Геномное окружение. База данных GO
1. Информация о КОГе, к которому относится белок рубредоксин (Methanosarcina acetivorans C2A)
Для работы использовался белок рубредоксин археи Methanosarcina acetivorans C2A(AAM05067.1), характеристика которого была ранее представлена на данной
странице. По запросу в CDD (Conserved Domain Database) было представлено 5 находок, из которых была выбрана
та, что имела наибольшее значение e-value. Информация о ней представлена в табл.1.
Таблица 1. Описание КОГа соответствующего белку рубредоксину (Methanosarcina acetivorans C2A)
Идентификатор |
COG4802 |
e-value |
1.26e-46 |
Интервал белка, в котором обнаруживается КОГ |
1-116 |
Название КОГа |
Ferredoxin-thioredoxin reductase, catalytic subunit
(феррредоксин-тиоредоксин редуктаза, каталитическая субъединица) |
Функциональная категория |
Energy production and conversion
(Синтез и превращения энергии) |
2. Визуализация геномного окружения
2.1. COGNAT
С помощью сервиса COGNAT было получено изображение геномного окружения для COG4802 (рис.1). Параметры запроса:
Neighborhood size - 9, Occurence threshold - 20%, Taxonomy - нет. На данном изображении
приведено показываются гены, которые отнесены к выбранному КОГу в 711 прокариотических геномах. Синим цветом выделен исходный КОГ (COG4802).
У многих цианобактерий (Cyanobacteria)
в консервативное окуржение данного КОГа попадает COG1547 - предсказанная металл-зависимая гидролаза (на рис. 1 выделен черным цыетом). У Euryarchaeota,
Proteobacteria, Euryarchaeota и некоторых
других групп организмов - COG0695 - глутаредоксин (выделен розовым цветом). Также можно заметить образование сшифок исходного КОГа и глутаредоксина у таких протеобактерий как Desulfotalea psychrophila LSv54,
Desulfobulbus propionicus DSM 2032.
Основываясь на полученных результатах можнно предположить, что данные пары КОГов функционально или физически связаны.
 |
Рис. 1. Геномное окружение для COG4802 (COGNAT)
| |
2.2. STRING
STRING - база данных об известных и предсказанных физических и функциональных белок-белковых взаимодействиях. На основе компьютерных предсказаний и данных из других баз
строится граф, узлах которого расположены различные КОГи, а ребра представляют связи. На рис. 2 приведен такой граф для COG4802.
 |
Рис. 2 Граф взаимодействий для COG4802 (STRING) |
На данном графе обозначены многие типы ассоциаций между белками: известные (экспериментально подтвержденные - с COG0633 и NOG79819, полученные из других баз данных),
предсказанные (на основе соседнего уонсервативного окружения, образования фьюжнов и совместной встречаемости), а также коэкспрессия, гомология и совместное упоминание в статьях.
На рис. 2 приведена сводная таблица связанных с COG4802 белков. По всем рассматриваемым в данной базе данных взаимодействиям рассчитывается score, принимающий значения
от 0 до 1, являющиеся некоторого рода индикатором уверенности, то есть с какой точностью можно утверждать о правдивости приводимых асссоциаций на основе имеющихся данных.
По таблице, приведенной на рис. 2 можно сказать, что почти все обнаруженные белки упоминаются вместе с исходным в каких-то литературных источниках (text-mining). Кроме того, для
трех из них имеются экспериментальные подтверждения связи с исходным COG4802. Также бросается в глаза образование фьюжнов с COG1592.
 |
Рис. 3 Сшивки для COG4802 (STRING) |
Рассмотрим подробнее образование фьюжнов с COG0376. COG0376 - это белок рубреритрин (Rubrerythrin)
На рис.4 приведено изображение, где можно увидеть, в каких именно группах имеет место образование такого фьюжна. Он имеется в таких группах как Firmicutes, Chloroflexi,
Euryarchaeota. Факт того, что дынное событие произошло в различных таксонах может указывать на то, что между данными белками имеется какая-то функциональная связь.
 |
Рис. 4 Фьюжны для COG4802 (STRING) |
3.1 Отнесение белка рубредоксина из Methanosarcina acetivorans C2A к терминам GO
С помощью инструмента AmiGO поиском BLAST по последовательности рубредоксина в БД GO был обнаружен белок ферредокин-тиоредоксин редуктаза (идентификатор DET_0199). Выравнивание найденного
белка с исходным приведено на рис.5. Длина выровненного участка составляет 86 а.о., Identities - 63%, e-value - 1.2e-45. Длина полученного белка на
4 а.о. меньше (у рубредоксина - 172, у ферредокин-тиоредоксин редуктазы - 168).
Найденный белок принадлежит бактерии Dehalococcoides mccartyi 195 .
Найденный в БД GO белок ферредокин-тиоредоксин редуктаза не являтся тем же самым, что и рубредоксин. Это неудивительно, так как они относятся к представителям из разных доменов (бактерии и археи,
соответственно). Поэтому переносить термины GO с ферредокин-тиоредоксин редуктазы на рубредоксин нецелесообразно. Для этого был взят другой белок - цитохром b человека (CYB_HUMAN).
 |
Рис.5. Выравнивание белка рубредоксина (Methanosarcina acetivorans C2A) и ферредокин-тиоредоксин редуктазы(Dehalococcoides mccartyi 195 ) |
3.2 Отнесение белка цитохрома b Homo sapiens к терминам GO
С помощью сервиса AmiGO поиском BLAST по последовательности цитохрома b в БД GO был обнаружен тот же белок (E-value = 4.0e-170). В табл. 2 представлены термины GO, относящиеся
к данному белку.
Таблица 2. Термины GO, отнесенные к белку с идентификатором Uniprot P00156 (CYB_HUMAN)
Аспект |
Идентификатор GO |
Название термина |
Перевод названия термина |
Код типа достоверности |
Биологический процесс (Biological process) |
GO:0031100 |
animal organ regeneration |
регенерация органов животных |
IEA |
Биологический процесс |
GO:1902600 |
hydrogen ion transmembrane transport |
трансмембранный перенс иона водорода |
IEA |
Биологический процесс |
GO:0042538 |
hyperosmotic salinity response |
ответ на гиперосмотический стресс |
IEA |
Биологический процесс |
GO:0006122 |
mitochondrial electron transport, ubiquinol to cytochrome c |
митохондриальный перенос электронов с убихинона на цитохром c |
NAS, TAS |
Биологический процесс |
GO:0046686 |
response to cadmium ion |
ответ на ион кадмия |
IEA |
Биологический процесс |
GO:0051592 |
response to calcium ion |
ответ на ион кальция |
IEA |
Биологический процесс |
GO:0033590 |
response to cobalamin |
ответ на витамин B12 |
IEA |
Биологический процесс |
GO:0046688 |
response to copper ion |
ответ на ион меди |
IEA |
Биологический процесс |
GO:0042493 |
response to drug |
ответ на действие препаратов |
IEA |
Биологический процесс |
GO:0045471 |
response to ethanol |
ответ на этанол |
IEA |
Биологический процесс |
GO:0033762 |
response to glucagon |
ответ на глюкагон |
IEA |
Биологический процесс |
GO:0009408 |
response to heat |
отверт на теловой шок |
IEA |
Биологический процесс |
GO:0055093 |
response to hyperoxia |
ответ на повышенное содержание кислорода |
IEA |
Биологический процесс |
GO:0001666 |
response to hypoxia |
ответ на гипоксию |
IEA |
Биологический процесс |
GO:0046689 |
response to mercury ion |
ответ на ионы ртути |
IEA |
Биологический процесс |
GO:0009636 |
response to toxic substance |
ответ на действие токсинов |
IEA |
Компонент клетки (cellular component) |
GO:0005743 |
mitochondrial inner membrane |
внутренняя мембрана митохондрий |
TAS |
Компонент клетки |
GO:0005750 |
mitochondrial respiratory chain complex III |
митохондриальный комплекс III |
NAS |
Компонент клетки |
GO:0005739 |
mitochondrion |
митохондрия |
IDA |
Молекулярная функция (molecular function) |
GO:0009055 |
electron carrier activity |
перенос электронов |
IEA |
Молекулярная функция |
GO:0046872 |
metal ion binding |
связывание иона металла |
IEA |
Молекулярная функция |
GO:0032403 |
protein complex binding |
связывание белкового комплекса |
IEA |
Молекулярная функция |
GO:0008121 |
ubiquinol-cytochrome-c reductase activity |
убихинол-цитохром-c редуктазная активность |
NAS |
Из найденных 23 терминов GO для данного белка, 18 имеют код достоверности IEA.
Отношение этих терминов к белку не проверено кураторами, а определно с помощью автоматизированных методов. Однако это не значит, что качество аннотации плохое,а лишь
отражает степень уверенности, с которой тот или иной термин может быть применен к рассматриваемому белку.
Таблица 3. Описание кодов достоверности, использованных в Таблице 2.
Код типа достоверности |
Расшифровка кода типа достоверности |
Объяснение |
IEA |
Inferred from Electronic Annotation |
Данный код присваивается автоматизированными методами, без пересмотра куратором на основе совпадений в похожих последовательностях, из записей баз данных.
|
NAS |
Non-traceable Author Statement |
Используется при желании куратора обозначить факт, не подтвержденный конкретным цитированием статьи. |
TAS |
Traceable Author Statement |
Используется при наличии статьи, где упоминается факт, но он прямо не подтвержден конкретными экспериментальными результатами. |
IDA |
Non-traceable Author Statement |
Используется при желании куратора обозначить факт, не подтвержденный конкретным цитированием статьи. |
IDA |
Inferred from Direct Assay |
Используется при наличии подтверждающих данных исследования соответствующей функции, процесса или компонента клетки. |