На главную

Занятие 6. Геномное окружение. База данных GO

Получение информации о КОГе, к которому относится белок

Задания данного практикума выполнены на примере белка карбапенем-гудролизующей металло-бета-лактамазы NDM-1 из бактерии Klebsiella oxytoca E718 (WP_004201164.1), работа с которым проводилась также в рамках выполнения практикума первого семестра.


Рис. 1. Выдача сервиса CDD для белка WP_004201164.1.

(длина белка – 270 а.о.)

При помощи сервиса CDD (Conserved Domain Database) был получен список находок, некоторые из которых относили белок к определенному КОГу. Такие хиты были отобраны, и для каждого из соответствующих КОГов получена информация, которая была сведена в Таблице 1.

Идентификатор КОГа E-value Остатки Название Функциональная категория
COG0491 2.06e-07 68-207 Glyoxylase or a related metal-dependent hydrolase, beta-lactamase superfamily II R (General function prediction only)
Глиоксалаза или связанная металл-зависимая гидролаза, надсемейство бета-лактамаз 2 Только общее предсказание функции
COG2333 9.60e-05 16-132 Metal-dependent hydrolase, beta-lactamase superfamily II R (General function prediction only)
Металл-зависимая гидролаза, надсемейство бета-лактамаз 2 Только общее предсказание функции

Визуализация геномного окружения

Организм, в котором был найден наиболее похожий на наш белок, достаточно далеко отстоит по таксономии от нашего:
Рис. 2. Таблица взаимосвязей COG 0491

Цвет ребер на рис. 3 имеет следующий смысл:

Цвет Значение
розовый экспериментально доказанные взаимосвязи
голубой взаимосвязи, информация о которых получена из курируемых баз данных
ярко-зеленый соседство в геноме
красный слияние генов
синий совместная встречаемость
светло-зеленый совместное упоминание данных белков в Pub-Med
черный коэкспрессия
сиреневый гомология


Рис. 3. Геномное окружение COG 0491

На рис. 3 мы видим, что у данной группы белков наблюдается консервативное геномное окружение. Так, наличие красных ребер показывает слияние генов белков нашего COG с генами белков из COG0318, COG0607, COG0494. Соседство (ярко-зеленые ребра) устойчиво наблюдается с генами белков NOG00011, COG0500. В выдаче Gene neighborhood (рис. 4) мы видим, что гены белков нашего COG и COG0607 слились только у бактерий, а соседство с COG0500 встречается также и у архей. Слияние с генами белков COG0494 и соседство с генами NOG00011 наблюдаются в различных группах бактериальных организмов.


Рис. 4. Gene neighborhood COG 0491

Отнесение белка карбапенем-гудролизующей металло-бета-лактамазы NDM-1 из генома бактерии Klebsiella oxytoca E718 к терминам GO

Поиском BLAST с помощью инструмента AmiGO были обнаружены белки, сходные с нашим в терминах GO. Лучшее из выравниваний (с Beta-lactamase II организма Bacillus anthracis) представлено на рис. 5. Этот белок не является тем же самым, но мера их сходства позволяет допустить использование этого белка для отнесения нашего к терминам GO.


Рис. 1. Выравнивание нашего белка с белком Q93T40 (Beta-lactamase II).

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
biological process (биологический процесс) GO:0017001 antibiotic catabolic process антибиотический катаболизм ISS
molecular function (молекулярная функция) GO:0008800 beta-lactamase activity бета-лактамазная активность ISS
Таблица 2. Термины GO, отнесенные к белку с идентификатором Uniprot Q93T40 (Q93T40_BACAN)

ISS Inferred from Sequence or structural Similarity Данный код используется в случаях, когда аннотация основана на анализе последовательностей в сочетании с ручной проверкой и использованием нескольких методов. Если использовался только один метод анализа последовательности, то используются подкатегории данного кода:
ISA (Inferred from Sequence Alignment)
ISO (Inferred from Sequence Orthology)
ISM (Inferred from Sequence Model)
Таблица 3. Описание кодов достоверности, использованных в Таблице 2.