Геномное окружение. База данных GO

Получение информации о КОГе

КОГ, к которому относится белок AKO92848.1 (acetoin utilization protein) был найден с помошью сервиса CCD. Данный белок был отнесен к COG0123. Информация о COG0123:
Величина e-value для белка к данному КОГу: 3.73e-103.
Интервал (по остаткам) в белке, в котором обнаруживается КОГ: 4-342 (длина всего белка 377 ао).
Название КОГа: Acetoin utilization deacetylase AcuC or a related deacetylase (деацетилазы AcuC или другие родственные деацетилазы утилизации ацетоина).
Функциональная категория КОГа: BQ.

Визуализация геномного окружения

Для обнаруженного в предыдущей части задания КОГа с помощью сервиса COGNAT было получено изображение геноного окружения. Параметры запуска COGNAT: Neighborhood size - 7 (несколько запусков с большим значением не выявило никаких закономерностей на расстоянии больше трех генов с каждой стороны), Occurrence Threshold - 5%, Taxonomy - Да (чтобы понимать является близость генов возникшей независимо в нескольких группах (тогда более значима) или общей для потомков одного предка).

Полное изображение геномного окружения COG0123 в 711 прокариотических геномах.


Геномного окружения консервативного во всех наблюдаеых случаях обнаружено не было. Но было найдено 2 КОГа, встречающихся в окружении COG0123 в нескольких таксономически удаленных группах прокариот. Эти 2 КОГа: COG1247 (L-amino acid N-acyltransferase YncA) и COG1042 (Acyl-CoAsynthetase (NDPforming)) - в большинстве случаев встречаются в окружении совместно, поэтому можно предположить, что они каким-то образом (например функционально) связаны между собой и с COG0123.

Изображение 1: геномное окружение COG0123 в двух таксономически удаленных группах. 1 стрелочка - 1 ген: светло-зеленые стрелочки - COG0123, темно-зеленые стрелочки - COG1247, фиолетовые стрелочки - COG1042.

Отнесение белка AKO92848.1 из бактерии Bacillus endophyticus к терминам GO

С помощью инструмента AmiGO поиском BLAST были найдены гомологи белка AKO92848.1. Лучшая находка- белок Q4KBB7_PSEF5 (EMBL:AAY92630.1, Full=Histone deacetylase family protein). Найденный белок принадлежит бактерии Pseudomonas protegens Pf-5 (отличается от вида бактерий у которых синтезируется искомый белок).
Выравнивание искоого белка с возможным гомологом имеет следующие параметры: P-value = 4.5e-82, количество одинаковых аминокислотных остатков = 45%, схожих аминокислотных остатков = 65%. Этот белок очевидно не является идентичным искомому, но достаточно высокая схожесть и малое значение P-value дают возожность предположить, что белки гомологичны.
В Таблице 1 приведены термены GO отнесенные к белку Q4KBB7. Мы предполагаем, что найденный белок гомологичен искомому, поэтому возможно, что те же термены относятся и к AKO92848.1. Однако найденный белок проаннотирован только в базовых терминах, так как данные для более глубокой классификации пока не были получены (подробнее тип достоверности ND в Таблице 2). А значит и для искомого белка (предполагая гомологичность) мы пока имеем информацию только о базовых терминах, относящихся к нему.

Таблица 1:Термины GO, отнесенные к белку с идентификатором Uniprot Q4KBB7 (Q4KBB7_PSEF5).

Аспект

Идентификатор GO

Название термина

Перевод названия термина

Код типа достоверности

Биологический процесс (Biological process)

GO:0008150

biological_process

биологический процесс

ND

Участие в молекулярных взаимодействиях(Molecular function)

GO:0003674

molecular_function

молекулярная функция

ND

Таблица 2:Описание кодов достоверности, использованных в Таблице 1.

Код типа достоверности

Расшифровка кода типа достоверности

Объяснение

ND

No biological Data available

Данный код присваивается в том случае, если не было найдено достоверных данных для отнесения белка к конкретному термину внутри базовых категорий: Molecular Function , Biological Process, или Cellular Component.

Четвертый семестр(весенний семестр 2018)


© Болихoва Анастасия 2017