Геномное окружение. База данных GO

1. Получение информации о COG белка BAU39574.1

Мой белок - BAU39574.1 hypothetical protein APT_02492 [Acetobacter pasteurianus NBRC 101655].

2. Визуализация геномного окружения COG5368

Рис. 1. Визуализация геномного окружения COG5368 среди прокариотических геномов, доступных базе данных COGNATa. Изображение получено с помощью сервиса COGNAT при параметрах программы по умолчанию: Neighborhood Size - 9, Occurrence Threshold - 20 %, Taxonomy - No. Темно-зелеными стрелками отмечен мой COG5368, светло-зеленым - КОГ, который, как предположила программа, составляет консервативное геномное окружение для моего КОГа.

Рис. 2. Визуализация геномного окружения COG5368 среди прокариотических геномов, доступных базе данных COGNATa. Изображение получено с помощью сервиса COGNAT при следующих параметрах программы: Neighborhood Size - 9, Occurrence Threshold - 16 %, Taxonomy - No. Темно-зелеными стрелками отмечен мой COG5368, остальные цветные стрелки соответствуют тем КОГам, которые, как предположила программа, составляют консервативное геномное окружение для моего КОГа.

Наиболее частовстречающимся КОГом оказался COG1629 (светло-зеленая стрелка, рис. 1). Он встречается только в половине представленных геномов, но в общем случае расположен относительного моего КОГа не случайным образом: в основном находится перед моим КОгом, и ко тому же в большинстве случаев раположен на расстоянии двух генов от моего КОГа. Скорее всего здесь действительно есть какая-то закономерность, и встречаемость COG1629 рядом с COG5368 и их расположение относительно друг друга в некоторой степени консервативно. Чтобы найти другие гипотетические КОГи, которые тоже могут составлять геномное окружение COG5368, я запустила COGNAT с меньшим порогом - 16 % (рис. 2). Голубая стрелка соответствует КОГу COG4771. Примечательно, что, во-первых, он, также как и COG1629, относится к мембранным рецепторам, а во-вторых, COG1629 и COG4771 вместе в одном геномном окружении моего КОГа не находятся ни в одном из выданных прокариотических геномов. Однако, этот КОГ встречается нечасто, и его локализация относительно моего КОГа непостоянна, поэтому у нес недостаточно оснований полагать, что COG4771 входит в консервативное геномное окружение COG5368.

Отнесение ALX08859.1 | oxidoreductase FAD/NAD(P)-binding domain protein из Hungateiclostridium thermocellum AD2 к терминам GO

Для выполнения этого задания я использовала новый белок, так как для моего белка из предыдущих заданий поиск по BLAST в БД GO ничего не дал.

P-value лучшей находки равен 1.5e-81, процент идентичности - 59 %, процент сходства - 71 %. Судя по этим цифрам находка скорее всего гомологична исходному белку. Организм, из которого выделили находку, - Carboxydothermus hydrogenoformans Z-2901 - филогенетически далека от Acetobacter pasteurianus NBRC 101655, эти бактерии принадлежат разным типам. Зато функции находки и исходного белка схожи: название находки - putative oxidoreductase, NAD-binding. Скорее всего они гомологи.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q3AAM3 (Q3AAM3_CARHZ).

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0008152 metabolic process метаболитический процесс ISS
Молекулярная функция (molecular function) GO:0016491 oxidoreductase activity оксидоредуктазная активность ISS

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Данный код присваивается, если для аннотации было использовано несколько различных методов анализа последовательности (если какой-то конкретный, то уточняется какой именно - ISO, ISM или ISA), а также структурное сходство.

Найденные термины в БД GO достаточно общие, и они не описывают в подробностях функцию находки, но с другой стороны это значит, что они большой долей вероятности применимы к моему белку (oxidoreductase FAD/NAD(P)-binding domain protein), то есть он участвует в метаболитических процессах и имеет оксидоредуктазную активность. Этот факт подкрепляется тем, что, как было уже выше сказано, находка достаточно гомологична моему белку, а также найденные термины имеют код типа достоверности ISS - достаточно хороший уровень достоверности.


© Агаева Зара, 2019