Геномное окружение. База данных GO

Вернуться на страницу семестра

1. Получение информации о КОГе (COmparative Gene), к которому относится белок

Дигуанилатциклаза участвует в формировании циклического ди-ГМФ, участвующего в формировании и сохранении бактериальной биопленки. Работаю с дигуанилатциклазой из генома бактерии Bordetella holmesii H558, которая уже упоминается в предыдущих практикумах. В энзимологии дигуанилатциклаза, также известная как дигуанилаткиназа (ЕС 2.7.7.65), представляет собой фермент, который катализирует химическую реакцию:
2 Гуанозинтрифосфат = 2 дифосфат + циклический ди-3 ', 5'-гуанилат
Идентификатор КОГа COG2199 с e-value 1.20e-44. КОГ обнаруживается с 292 по 451 остаток белка (поле Interval в результатах CDD). Всего в белке 452 остатка. Название КОГа GGDEF (домен GGDEF, дигуанилатциклаза или её ферментативно неактивные варианты) категория T - Signal transduction mechanisms (Механизмы передачи сигналов).

2. Визуализация геномного окружения

Геномное окружение исследуемого белка было визуализировано с помощью базы данных COGNAT. О работе базы данных: Одна стрелочка = 1 ген. Показываются все гены, которые отнесены к выбранному КОГу в 711 прокариотических геномах (последний релиз базы данных, 2015 г.), и их геномное окружение. Neighborhood size – общее число генов, которые будут показаны, включая целевой ген (поровну слева и справа от целевого гена). Occurence threshold – если ген, продукт которого относится к какому-то КОГу, встречается в большем % случаев на рисунке, то все находки данного КОГа будут покрашены.
Мною были выбраны следующие параметры: Neighborhood size = 7, Occurence threshold = 20%, Таксономия НЕТ

Рисунок 1. Часть результата поиска



Розовым указан начальный COG2199. В геномном окружении нашелся COG5001 (салатовый) - предсказанный белок передачи сигнала, содержащий мембранный домен, EAL и домен GGDEF. При этом консервативности в геномном окружении не наблюдается, но часто 2 этих КОГа находятся друг за другом. Это можно объяснить тем, что они оба связаны с доменом GGDEF.

3. Отнесение дигуанилатциклазы из генома бактерии Bordetella holmesii к терминам GO


С помощью инструмента AmiGO поиском BLAST обнаружен в БД GO белок diguanylate cyclase (dosC) из Escherichia coli K-12 с p-value (это лучшая находка) = 1.5e-65. Данные по выравниванию: Identities = 144/417 (34%), Positives = 234/417 (56%) - очевидно, это не оин и тот же белок, но степень схожести я считаю достаточной, оба белка принадлежат прокариотическим организмам и выполняют одинаковые функции.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P0AA89 (DOSC_ECOLI)

АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Молекулярная функцияGO:0052621diguanylate cyclase activityдигуанилатциклазная активностьIDA, IGI
Молекулярная функцияGO:0020037heme bindingсвязывание гемаIDA
Молекулярная функцияGO:0019825oxygen bindingсвязывание кислородаIDA
Молекулярная функцияGO:0005515protein bindingсвязывание белкаIPI

Таблица 2. Описание кода достоверности, использованного в Таблице 1

Код типа достоверностиРасшифровкаОбъяснение
IDAInferred from Direct AssayДанный код используется, когда при аннотации использовались биохимические или клеточные методы для описания локализации, молекулярной функции белка или роли в биологическом процессе
IGIInferred from Genetic InteractionДанный код используется, когда аннотация основана на экспериментах, сообщающих об эффектах при нарушениях более чем одного продукта гена, например, последствия множественных мутаций
IPIInferred from Physical InteractionДанный код используется для аннотирования физических взаимодействий между представляющей интерес субъектом и другой молекулой (такой как белок, ион или комплекс)

Были проанализированы данные из базы данных GO. База данных GO представляет собой граф биологических терминов (GO terms), соединенных различными отношениями (relations). На странице найденного с помощью BLAST белка я нашла данные о его функциях и внесла в таблицу 1. Графа таблицы 1 "Код типа достоверности" может показаться непонятной, поэтому пояснения и расшифровки для кодов достоверности внесены в таблицу 2. Все типы относятся или к Experimental Evidence codes, или к High Throughput (HTP) evidence codes, и их достоверность достаточно высока.




© Миронова Екатерина 2018 год