Геномное окружение. База данных GO

Получение информации о КОГе, к которому относится данный белок

Для выполнения задания была использована последовательность белка фосфоглицераткиназы бактерии Coxiella burnetii RSA 493 с идентификатором NP_820762.2. Белок состои из 404 а.о.
С помощью сервиса CDD(Conserved Domain Database) для данного белка был получен список хитов, из которого были выбраны только те, которые относятся к какому-либо КОГу.

Список хитов для белка NP_820762.2

Как можно видеть, КОГ нашелся всего один. Информация о нем была получена, в соответствии с последним релизом базы данных и сведена в таблицу 1.

Таблица 1. Общие сведения о КОГе

IDE-valueКоординаты НазваниеФункциональная категория
COG0126 0e+0012-399 3-phosphoglycerate kinase
(3-фосфоглицераткиназа)
G - Carbohydrate transport and metabolism
(Транспорт и метаболизм углеводов)

Визуализация геномного окружения

Спомощью сервиса STRING был осуществлен поиск по белку с указанным организмом: Coxiella burnetii RSA493 и найдено его геномное окружение.
Параметры отображения были оставлены по умолчанию (minimum required interaction score:0.400; max number of interactors to show: 10 для 1st shell - первого уровня родства)

Изображение геномного окружения COG0126, STRING

Узлы графа обозначают КОГи, ребра графа обозначают как взимодействие, так и функциональную связь.

Узлы графа

Ребра графа

Gene neighbourhood для COG0126

Цветами обозначены соответствующие легенде КОГи, белыми стрелками обозначены гены из других КОГов, а их направление указывает на направление транскрипции.

Второй паттерн присутствует практически во всех представленных таксонах, поэтому его можно назвать консервативным.

Отнесение белка к терминам GO

С помощью инструмента AmiGO поиском BLAST в БД GO были найдены последовательности, схожие с данной. Как оказалось, в базе данных присутствует рассматриваемый белок.

Термины GO, отнесенные к белку Q83AU6 (uniprot)

АспектИдентификатор GOНазвание терминаПеревод названия Код типа достоверности
Биологический процесс
(Biological process)
GO:0006096 glycolytic processГликолитический процессISS
Молекулярная функция
(Molecular function)
GO:0004618 phosphoglycerate kinase activity Активность фосфоглицераткиназыISS

Описание кода достоверности:

КодРасшифровкаОбъяснение
ISSInferred from sequence similarity/в основе - сходство последовательностей или структурноеISS код или одна из его разновидностей используется, когда в основе аннотации лежал анализ последовательностей, при этом он должен был быть проверен вручную. Если такой проверки не производилось, корректно использовать код IEA. Общий код ISS должен быть указан, если применяется комбинация анализирующих сиквенсы инструментов и методов. В случае использования лишь одного метода следует указывать одну из подкатегорий ISS: ISA (Inferred from Sequence Alignment) - при анализе парного или множественного выравнивания, ISO (Inferred from Sequence Orthology) - при оценке ортологичности продуктов генов из разных организмов, ISM (Inferred from Sequence Model) - при использовании какого-либо метода моделирования (например, скрытой марковской модели). ISS также можно использовать при наличии структурного сходства с экспериментально описанными продуктами генов, установленного с помощью кристаллографии, ЯМР или вычислительных предсказаний. На практике код ISS практически никогда не применяют для аннотации, основанной только на информации о структуре. Если информация о ней и включается, то обычно она представляет собой данные моделирования вторичной структуры или предсказания структуры, основанного на последовательности. Информация о вторичной структуре бывает особенно полезна в качестве одного из компонентов предсказаний РНК-генов и в некоторых моделях доменов.

Назад
На главную



© Кучеренко Варвара 2015