Учебный сайт Морозова Александра
<< Назад к странице 4 семестра

Практикум 11

Геномное окружение. База данных GO

1. Получение информации о КОГе, к которому относится данный белок

С помощью сервиса CDD (Conserved Domain Database) для данный белок был отнесен к единственному КОГу:

ID: COG0546

E-value: 7.31e-30

Интервал: 8-188

Всего остатков в белке: 210

Название: Phosphoglycolate phosphatase, HAD superfamily (фосфогликолятгидролаза из суперсемейства HAD)

Функциональная категория: Energy production and conversion (производство и превращения энергии)

2. Визуализация геномного окружения

Рис. 1. Фрагмент изображения геномного окружения

Полное изображение в формате pdf доступно по ссылке.

Параметры поиска:

Neighborhood Size - 9

Occurrence Threshold (%) - 20

Taxonomy - Нет

Цветом покрашены КОГи, встречающиеся более чем в 20% находок, зеленый - КОГ, к которому относится наш белок.

Как можно видеть, при таком пороге не оказался окрашенным ни один ген, кроме искомого. При понижении порога до 1% (полученный pdf доступен по ссылке) консервативности в окружении данного КОГа в целом не наблюдается, однако у некоторых групп организмов данный КОГ сопряжен с COG1932, COG1360, COG0188, что может косвенно говорить о функциональной взаимосвязи закодированных в них белков.

3. Отнесение белка HAD superfamily hydrolase из Geobacter sulfurreducens к терминам GO

Рис. 2. Выравнивание нашего белка с лучшей находкой

При помощи AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на данный (Uniprot ID: Q74BH2).

P-value: 1.8e-110

Identities = 210/210 (100%)

Организм: Geobacter sulfurreducens

Таким образом, можно сделать вывод, что найденный белок - тот же самый, что и наш.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q74BH2 (Q74BH2_GEOSL)

Аспект

Идентификатор GO

Название термина

Перевод названия термина

Код типа достоверности

biological process (биологический процесс)

GO:0008152

metabolic process

метаболический процесс

ISS

molecular function (молекулярная функция)

GO:0016787

hydrolase activity

гидролазная активность

ISS

ISS - Inferred from Sequence or structural similarity - достоверность проверялась вручную специалистом через анализ последовательностей.

Цель данного задания - познакомиться с системой терминов GO. Для последовательности данного (нашего) белка были найдены все термины, ассоциированные с ним по данным инструмента AmiGO. Было обнаружено два термина с кодом достоверности ISS, который говорит о высокой достоверности (данные были проверены вручную).