База данных GO: Геномное окружение

Информация о COG изучаемого белка

Для дальнейшей работы был выбран белок бактерии Corynebacterium pseudotuberculosis 31 4-α-глюкотрансфераза (gb|AFH91336.1) - далее "наш белок".
Таблица 1.КОГ 4-α-глюканотрансферазы
Идентификатор COGCOG1640
E-value COG по CDD1.52e-148
Интрвал, занятый COG в белке (координаты аминокислотных остатков)189-713
Общее число аминокислотных остатков в белке728
Название COG/ COG nameMalQ
Описание4-α-глюканотрансфераза [Углеводный транспорт и обмен веществ]/4-alpha-glucanotransferase [Carbohydrate transport and metabolism]
Функциональная категория COG/ Functional COG category 4-α-глюканотрансфераза/4-alpha-glucanotransferase(G)

Визуализация геномного окружения

Ниже представлено изображение геномного окружения для обнаруженного COG с помощью COGNAT:

Рисунок 1. Геномное окружение COG1640

Параметры, введённые на инпут программы:

Полная выдача представлена в формате pdf: cognat.pdf

На рисунке Списком слева представлены организмы, в которых рассматривается геномное окружение COG. Первыми, серым шрифтом, представлены их идентификаторы в базе данных NCBI, после - видовое наименование(периодически с точностью до штамма). Справа схметично изображены гены - одна стрелка = один ген. Показываются все гены, которые отнесены к выбранному COG в 711 прокариотических геномах и их геномное окружение.

Для изучаемого COG поиск проводился в интервале 9 белков - 4 справа и 4 слева. Зелёным цветом отмечены гены, встречающиеся более чем в 20% случаев (задано через Threshold), находки не сортировались по таксономии.

Консервативное окружение образуют COG0366 - Гликозидаза и COG0296 - 1,4-альфа-глюкан-разветвляющийся фермент показаны, соответственно, тёмно-серым и фиолетовым. Эти два белка связаны функционально: 4-α-глюкотрансфераза представляет собой фермент, который катализирует химическую реакцию, которая переносит сегмент 1,4-альфа-D-глюкана в новое положение в акцепторном углеводе: глюкоза или 1,4-альфа-D-глюкан. Гликозидазы катализируют гидролиз гликозидных связей в молекулах углеводов, приводя к появлению двух более мелких молекул углеводов, 1,4-альфа-глюкан-разветвляющийся фермент, как можно догадаться из названия, разветвляет углеводороды.

В консервативном окружении наблюдается вариабельность - сами домены могут экспрессироваться с одного промотора вместе с гликозилазой, и ветвящие энзимы дублируются порой дублируются в геноме, так же нет никакого правила, по которому они располагаются относительно нашего белка: раньше или после.

Отнесение белка 4-α-глюкотрансферазы из Corynebacterium pseudotuberculosis 31 к терминам GO

Лучшей находкой по версии AmiGO является белок холерного вибриона Q9KNF0_VIBCH|VC_A0014. Этот же белок, среди всех остальных, был выбран как лучший из имеющихся, так как иные 4-α-глюкотрансферазы так же относятся к phylum Protobacteria (а не Actinobacteria, как исходная бактерия), но с меньшими p-value.
P-value лучшей находки: 1.3e-71.
Все остальные находки приведены ниже. в (Табл.2).

Таблица 2. Термины GO, относимые к белку
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс/Biological process) GO:0005980 glycogen catabolic process катаболический процесс гликогена ISS
Молекулярная функция/Molecular function

GO:0004134

glucanotransferase activity

активность глюканотрансферазы

ISS

Таблица 3. Расшифровка кодов достоверности

Код типа достоверности

Расшифровка кода достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Буквально "определимая из последовательности или структурного сходства"
Этот код используется всякий раз, когда основанный на последовательности анализ формирует основу для аннотации. ISS следует использовать, если используется комбинация инструментов или методов для определения последовательности, которые дают какие-то доказательства. На практике аннотации ISS редко, если вообще когда-либо, сделаны исключительно из структурной информации, структурная информация обычно находится на уровне моделирования вторичной структуры или прогнозирования, полученного из информации о последовательности.

Итого нами был произведён поиск по BLAST нашего белка против базы данных GO. Полученные результаты на сервисе AmiGO были скопманованы в таблицу с указанием E-value, именем белка, идентификатором GO, информацией о видах носителях-белков. После того, проанализировав информацию о видах, представленных в таблице, был выявлен белок, наиболее походящий на исследованный. Для этого белка с помощью все того же сервиса AmiGo были определены тематики, относящиеся к нему, через GO-термины, определённые для того (Табл.1) - функции в соответствующем организме. Соответственные для терминов коды типа достоверности так же были определены далее(Табл.2). Например, теперь для белка AFH91336.1 можно говорить о его достоверном участии в катаболизме гликогена в организме, с осуществлением глюканотрансферазной функции.



Ссылки на ресурсы:


Вернуться назад

На главную страницу


©Solonovich Vera,2017