Исследование данных UniProt о белке 4-hydroxy-3-methylbut-2-enyl diphosphate reductase

Выбор белка

Моей бактерий ей была Psychrobacter alimentarius. Секвенирование ее генома было совершено потому, что синтез терпеноидов в этом организме проходит по MEP/DOXP (мевалонат-независимому) пути. Поэтому я искала ферменты, участвующие именно в этом биологическом процессе.

(taxonomy_id:261164) AND isoprenoid

В Advanced Search нахожу в поле Taxonomy [OC] свою бактерию, имеющую номер 261164, затем добавляю в поле All слово 'isoprenoid', чтобы выбрать белки, участвующие в синтезе терпеноидов.
По моему запросу Uniprot находит 8 белков, все из базы TrEMBL. Все они имеют 3 степень достоверности, то есть предположения об их существовании строится на гомологии. Видно, что степень аннотации не превышает 3/5, поэтому выбирать нужно именно из этих 4 белков.

Дальнейший выбор я строила на структуре белка. Белки A0A144NQI8_9GAMM и A0A144Q000_9GAMM имеют предсказанные структуры с наивысшей точностью, однако у A0A144NZQ6_9GAMM "недостаточно консервативных остатков для распространения аннотации". Поэтому работать я буду с белком A0A144Q000_9GAMM.

Краткое описание

Название: 4-hydroxy-3-methylbut-2-enyl diphosphate reductase

Перевод названия: 4-гидрокси-3-метилбут-2-енилдифосфат-редуктаза

EC: 1.17.7.4

Ген: ispH

Функция: Катализирует терминальную реакцию DOXP/MEP-пути синтеза предшественников терпеноидов, в которой из HMBPP получается IPP и DMAPP

Кофактор: 4Fe-4S кластер

Кластеры

UniRef100_A0A144Q000
Size:3

UniRef90_Q4FQY8
Size:111

UniRef50_B5Y232
Size:652

Все кластеры крупные, причем в них входят только белки с названием 4-hydroxy-3-methylbut-2-enyl diphosphate reductase. Я читала, что мевалонат-независимый путь встречается у некоторых бактерий, водорослей, высших растений и апикомплексовых, поэтому стало интересно посмотреть, какие таксоны входят в кластер-50, и оказалось, что 415 организмов из UniProtKB - bacteria (eubacteria), 3 - метагеномы (морские) из UniProtKB, а остальные находятся в базе UniParc (большинство так же метагеномы). Это говорит о том, что последовательность довольно консервативна у бактериальных организмов, так как в кластер-50 входят бактерии различных классов (хотя подавляющее большинство все же из Gammaproteobacteria). Тогда бактериальный белок довольно консервативен, а если смотреть среди всех организмов с этим белком, то он вариативен, так как встречается в совершенно разных организмах.

Запросы

1. Белок имеет аннотацию 3/5 и его существование обосновывается гомологией. Попробуем найти бактериальный белок, который может подойти под этот "гомологичный белок".

(protein_name:"4-hydroxy-3-methylbut-2-enyl diphosphate reductase") AND (taxonomy_id:1236) AND (existence:1)

Для этого стоит применить расширенный поиск со следующими парамерами:
Protein Name [DE]: 4-hydroxy-3-methylbut-2-enyl diphosphate reductase - найдем, есть ли подходящие белки с таким же названием
AND Taxonomy [OC]: Gammaproteobacteria [1236] - посмотрим их существование сразу в достаточно крупном таксоне - классе
AND Protein Existence [PE]: Evidence at protein level - так как на основании искомого белка делают предположения о существовании гомологичных, то сам белок должен был быть получен
Отлично, получаем единственный белок с очень высокой степенью изученности: Аннотация 5/5 и полученный из известной Escherichia coli (strain K12).

2. Последовательность белка была загружена 08-JUN-2016, и после этого не обновлялась. Посмотрим, находили ли этот белок в других организмах рода Psychopacter в течение последних трех лет.

protein_name:"4-hydroxy-3-methylbut-2-enyl diphosphate reductase") AND (taxonomy_id:497) AND (lit_pubdate:[2020-03-22 TO 2023-03-22])

Вводим параметры поиска. Поставлю поиск по Publications (чтобы посмотреть статью, подкрепляющую находку).
Поиск выдал 4 результата (и интересно, что все публикации датируются июлем-сентябрем 2020 года). Однако видно, что все они не имеют аннотацию 3/5 и их существование основано на гомологии. Наверное, доскональное исследование этих белков не актуально, поэтому их заносят в базу при разборе генома определенного организма.