Геномное окружение. База данных GO

1. Информация о КОГе, к которому относится белок рубредоксин (Methanosarcina acetivorans C2A)

Для работы использовался белок рубредоксин археи Methanosarcina acetivorans C2A(AAM05067.1), характеристика которого была ранее представлена на данной странице. По запросу в CDD (Conserved Domain Database) было представлено 5 находок, из которых была выбрана та, что имела наибольшее значение e-value. Информация о ней представлена в табл.1.

Таблица 1. Описание КОГа соответствующего белку рубредоксину (Methanosarcina acetivorans C2A)

Идентификатор COG4802
e-value 1.26e-46
Интервал белка, в котором обнаруживается КОГ 1-116
Название КОГа Ferredoxin-thioredoxin reductase, catalytic subunit (феррредоксин-тиоредоксин редуктаза, каталитическая субъединица)
Функциональная категория Energy production and conversion (Синтез и превращения энергии)



2. Визуализация геномного окружения

2.1. COGNAT

С помощью сервиса COGNAT было получено изображение геномного окружения для COG4802 (рис.1). Параметры запроса: Neighborhood size - 9, Occurence threshold - 20%, Taxonomy - нет. На данном изображении приведено показываются гены, которые отнесены к выбранному КОГу в 711 прокариотических геномах. Синим цветом выделен исходный КОГ (COG4802). У многих цианобактерий (Cyanobacteria) в консервативное окуржение данного КОГа попадает COG1547 - предсказанная металл-зависимая гидролаза (на рис. 1 выделен черным цыетом). У Euryarchaeota, Proteobacteria, Euryarchaeota и некоторых других групп организмов - COG0695 - глутаредоксин (выделен розовым цветом). Также можно заметить образование сшифок исходного КОГа и глутаредоксина у таких протеобактерий как Desulfotalea psychrophila LSv54, Desulfobulbus propionicus DSM 2032. Основываясь на полученных результатах можнно предположить, что данные пары КОГов функционально или физически связаны.

Рис. 1. Геномное окружение для COG4802 (COGNAT)


2.2. STRING

STRING - база данных об известных и предсказанных физических и функциональных белок-белковых взаимодействиях. На основе компьютерных предсказаний и данных из других баз строится граф, узлах которого расположены различные КОГи, а ребра представляют связи. На рис. 2 приведен такой граф для COG4802.

Рис. 2 Граф взаимодействий для COG4802 (STRING)

На данном графе обозначены многие типы ассоциаций между белками: известные (экспериментально подтвержденные - с COG0633 и NOG79819, полученные из других баз данных), предсказанные (на основе соседнего уонсервативного окружения, образования фьюжнов и совместной встречаемости), а также коэкспрессия, гомология и совместное упоминание в статьях. На рис. 2 приведена сводная таблица связанных с COG4802 белков. По всем рассматриваемым в данной базе данных взаимодействиям рассчитывается score, принимающий значения от 0 до 1, являющиеся некоторого рода индикатором уверенности, то есть с какой точностью можно утверждать о правдивости приводимых асссоциаций на основе имеющихся данных. По таблице, приведенной на рис. 2 можно сказать, что почти все обнаруженные белки упоминаются вместе с исходным в каких-то литературных источниках (text-mining). Кроме того, для трех из них имеются экспериментальные подтверждения связи с исходным COG4802. Также бросается в глаза образование фьюжнов с COG1592.

Рис. 3 Сшивки для COG4802 (STRING)

Рассмотрим подробнее образование фьюжнов с COG0376. COG0376 - это белок рубреритрин (Rubrerythrin) На рис.4 приведено изображение, где можно увидеть, в каких именно группах имеет место образование такого фьюжна. Он имеется в таких группах как Firmicutes, Chloroflexi, Euryarchaeota. Факт того, что дынное событие произошло в различных таксонах может указывать на то, что между данными белками имеется какая-то функциональная связь.

Рис. 4 Фьюжны для COG4802 (STRING)


3.1 Отнесение белка рубредоксина из Methanosarcina acetivorans C2A к терминам GO

С помощью инструмента AmiGO поиском BLAST по последовательности рубредоксина в БД GO был обнаружен белок ферредокин-тиоредоксин редуктаза (идентификатор DET_0199). Выравнивание найденного белка с исходным приведено на рис.5. Длина выровненного участка составляет 86 а.о., Identities - 63%, e-value - 1.2e-45. Длина полученного белка на 4 а.о. меньше (у рубредоксина - 172, у ферредокин-тиоредоксин редуктазы - 168). Найденный белок принадлежит бактерии Dehalococcoides mccartyi 195 .

Найденный в БД GO белок ферредокин-тиоредоксин редуктаза не являтся тем же самым, что и рубредоксин. Это неудивительно, так как они относятся к представителям из разных доменов (бактерии и археи, соответственно). Поэтому переносить термины GO с ферредокин-тиоредоксин редуктазы на рубредоксин нецелесообразно. Для этого был взят другой белок - цитохром b человека (CYB_HUMAN).

Рис.5. Выравнивание белка рубредоксина (Methanosarcina acetivorans C2A) и ферредокин-тиоредоксин редуктазы(Dehalococcoides mccartyi 195 )


3.2 Отнесение белка цитохрома b Homo sapiens к терминам GO

С помощью сервиса AmiGO поиском BLAST по последовательности цитохрома b в БД GO был обнаружен тот же белок (E-value = 4.0e-170). В табл. 2 представлены термины GO, относящиеся к данному белку.

Таблица 2. Термины GO, отнесенные к белку с идентификатором Uniprot P00156 (CYB_HUMAN)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0031100 animal organ regeneration регенерация органов животных IEA
Биологический процесс GO:1902600 hydrogen ion transmembrane transport трансмембранный перенс иона водорода IEA
Биологический процесс GO:0042538 hyperosmotic salinity response ответ на гиперосмотический стресс IEA
Биологический процесс GO:0006122 mitochondrial electron transport, ubiquinol to cytochrome c митохондриальный перенос электронов с убихинона на цитохром c NAS, TAS
Биологический процесс GO:0046686 response to cadmium ion ответ на ион кадмия IEA
Биологический процесс GO:0051592 response to calcium ion ответ на ион кальция IEA
Биологический процесс GO:0033590 response to cobalamin ответ на витамин B12 IEA
Биологический процесс GO:0046688 response to copper ion ответ на ион меди IEA
Биологический процесс GO:0042493 response to drug ответ на действие препаратов IEA
Биологический процесс GO:0045471 response to ethanol ответ на этанол IEA
Биологический процесс GO:0033762 response to glucagon ответ на глюкагон IEA
Биологический процесс GO:0009408 response to heat отверт на теловой шок IEA
Биологический процесс GO:0055093 response to hyperoxia ответ на повышенное содержание кислорода IEA
Биологический процесс GO:0001666 response to hypoxia ответ на гипоксию IEA
Биологический процесс GO:0046689 response to mercury ion ответ на ионы ртути IEA
Биологический процесс GO:0009636 response to toxic substance ответ на действие токсинов IEA
Компонент клетки (cellular component) GO:0005743 mitochondrial inner membrane внутренняя мембрана митохондрий TAS
Компонент клетки GO:0005750 mitochondrial respiratory chain complex III митохондриальный комплекс III NAS
Компонент клетки GO:0005739 mitochondrion митохондрия IDA
Молекулярная функция (molecular function) GO:0009055 electron carrier activity перенос электронов IEA
Молекулярная функция GO:0046872 metal ion binding связывание иона металла IEA
Молекулярная функция GO:0032403 protein complex binding связывание белкового комплекса IEA
Молекулярная функция GO:0008121 ubiquinol-cytochrome-c reductase activity убихинол-цитохром-c редуктазная активность NAS

Из найденных 23 терминов GO для данного белка, 18 имеют код достоверности IEA. Отношение этих терминов к белку не проверено кураторами, а определно с помощью автоматизированных методов. Однако это не значит, что качество аннотации плохое,а лишь отражает степень уверенности, с которой тот или иной термин может быть применен к рассматриваемому белку.


Таблица 3. Описание кодов достоверности, использованных в Таблице 2.

Код типа достоверности Расшифровка кода типа достоверности Объяснение
IEA Inferred from Electronic Annotation Данный код присваивается автоматизированными методами, без пересмотра куратором на основе совпадений в похожих последовательностях, из записей баз данных.
NAS Non-traceable Author Statement Используется при желании куратора обозначить факт, не подтвержденный конкретным цитированием статьи.
TAS Traceable Author Statement Используется при наличии статьи, где упоминается факт, но он прямо не подтвержден конкретными экспериментальными результатами.
IDA Non-traceable Author Statement Используется при желании куратора обозначить факт, не подтвержденный конкретным цитированием статьи.
IDA Inferred from Direct Assay Используется при наличии подтверждающих данных исследования соответствующей функции, процесса или компонента клетки.


© Васильева Елена, 2015