Геномное окружение. База данных GO



Получение информации о КОГе


Для работы был выбран белок inosine-5-monophosphate dehydrogenase [Lactobacillus plantarum]. С помощью сервиса CDD этот белок был отнесен к следующему КОГу:
Идентификатор КОГа: COG1304
Величина e-value для отнесения белка к данному КОГу: 5.64e-04
Интервал: 15-253 (всего в белке 383 а.о.)
Название КОГа (на англ.): FMN-dependent dehydrogenase, includes L-lactate dehydrogenase and type II isopentenyl diphosphate isomerase.
Функциональная категория (на рус.): C (Energy production and conversion), I (Lipid transport and metabolism), R (General function prediction only).
Название КОГа (на англ.): FMN-зависимая дегидрогеназа, включает L-лактат дегидрогеназу и изопентенилдифосфат-изомеразу II типа.
Функциональная категория (на рус.): C (Производство и преобразование энергии), I (Транспорт и метаболизм липидов), R (Предсказана только общая функция).

Визуализация геномного окружения




Полученное программой COGNAT изображение геномного окружения генов, отнесенных к КОГу COG1304, в 711 прокариотических геномах, гены показаны стрелочками, которые покрашены в соответствии с Occurence threshold; параметры: Neighborhood Size - 9, Occurrence Threshold (%) - 10, Taxonomy - Нет; обозначения: бледно-зеленая стрелочка - ген, отнесенный к COG1304, желто-зеленая стрелочка - ген, отнесенный к COG1577, салатовая стрелочка - ген, отнесенный к COG1028 или в виде pdf-файла

То есть на изображении геномного окружения выделены цветом только те гены, относящиеся к какому-то КОГу, доля которых на картинке составила больше 10%. Здесь консервативное геномное окружение не наблюдается, но, можно сказать, что у некоторых организмов его более-менее формируют гены, отнесенные к COG1577 (Mevalonate kinase, I) или COG1028 (NAD(P)-зависимая дегидрогеназа, IQR). Исходя из функций белков этих генов, можно предположить, что их объединяет функция транспорта и метаболизма липидов (I), поэтому в геноме они идут близко друг к другу.

Отнесение белка инозин-5-монофосфат дегидрогеназы из Lactobacillus plantarum к терминам GO



Лучшая находка, то есть наиболее похожий белок - инозин-5'-монофосфат дегидрогеназа (организм - Bacillus anthracis str. Ames). Bacillus anthracis и Lactobacillus plantarum относятся к одному классу Бациллы, но к разным порядкам: Bacillales и Lactobacillales, соответственно, то есть они достаточно близки. Длина этого белка - 487 а.о.
Характеристика этой находки:
P value - 2.8e-122
С 100 а.о. нашего белка по 381 а.о.: Score - 957, Identities - 188/282 (66%), Positieves - 225/282 (79%)
С 4 а.о. нашего белка по 79 а.о.: Score - 266, Identities - 50/76 (65%), Positieves - 65/76 (85%)
Можно сделать вывод, что эти белки достаточно похожи, за исключением того, что белок из Bacillus anthracis имеет в середине последовательности вставку из 150 а.о., которой нет в нашем белке. То есть мы нашли белок из базы данных GO, максимально похожий на наш. Краткая информация про него, полученная из этой базы данных, приведена ниже.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q81W29 (A0A0J1HJU0_BACAN)
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0009152 purine ribonucleotide biosynthetic process биосинтетическая обработка пуриновых рибонуклеотидов ISS
Молекулярная функция GO:0003938 IMP dehydrogenase activity инозинмонофосфат дегидрогеназная активность ISS


Отсюда можно сделать вывод, что наш белок вовлечен в биосинтетическую обработку пуриновых рибонуклеотидов и проявляет инозинмонофосфат дегидрогеназная активность.

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Данный код присваивается, когда аннотация основана на анализе in silico генетической последовательности, с использованием вычислительного анализа и было установлено сходство по структуре или по последовательности с каким-то белком, имеющим эти особенности


Из Таблицы 2 можно сделать вывод, что доказательства свойств нашего белка не самые надежные, то есть они основаны не на конкретном эксперименте, подтверждающем гипотезу, а на основе сравнения с уже известными белками.


©Makarikova Olga 2019