Мой белок - BAU39574.1 hypothetical protein APT_02492 [Acetobacter pasteurianus NBRC 101655].
Рис. 1. Визуализация геномного окружения COG5368 среди прокариотических геномов, доступных базе данных COGNATa. Изображение получено с помощью сервиса COGNAT при параметрах программы по умолчанию: Neighborhood Size - 9, Occurrence Threshold - 20 %, Taxonomy - No. Темно-зелеными стрелками отмечен мой COG5368, светло-зеленым - КОГ, который, как предположила программа, составляет консервативное геномное окружение для моего КОГа.
Рис. 2. Визуализация геномного окружения COG5368 среди прокариотических геномов, доступных базе данных COGNATa. Изображение получено с помощью сервиса COGNAT при следующих параметрах программы: Neighborhood Size - 9, Occurrence Threshold - 16 %, Taxonomy - No. Темно-зелеными стрелками отмечен мой COG5368, остальные цветные стрелки соответствуют тем КОГам, которые, как предположила программа, составляют консервативное геномное окружение для моего КОГа.
Наиболее частовстречающимся КОГом оказался COG1629 (светло-зеленая стрелка, рис. 1). Он встречается только в половине представленных геномов, но в общем случае расположен относительного моего КОГа не случайным образом: в основном находится перед моим КОгом, и ко тому же в большинстве случаев раположен на расстоянии двух генов от моего КОГа. Скорее всего здесь действительно есть какая-то закономерность, и встречаемость COG1629 рядом с COG5368 и их расположение относительно друг друга в некоторой степени консервативно. Чтобы найти другие гипотетические КОГи, которые тоже могут составлять геномное окружение COG5368, я запустила COGNAT с меньшим порогом - 16 % (рис. 2). Голубая стрелка соответствует КОГу COG4771. Примечательно, что, во-первых, он, также как и COG1629, относится к мембранным рецепторам, а во-вторых, COG1629 и COG4771 вместе в одном геномном окружении моего КОГа не находятся ни в одном из выданных прокариотических геномов. Однако, этот КОГ встречается нечасто, и его локализация относительно моего КОГа непостоянна, поэтому у нес недостаточно оснований полагать, что COG4771 входит в консервативное геномное окружение COG5368.
Для выполнения этого задания я использовала новый белок, так как для моего белка из предыдущих заданий поиск по BLAST в БД GO ничего не дал.
P-value лучшей находки равен 1.5e-81, процент идентичности - 59 %, процент сходства - 71 %. Судя по этим цифрам находка скорее всего гомологична исходному белку. Организм, из которого выделили находку, - Carboxydothermus hydrogenoformans Z-2901 - филогенетически далека от Acetobacter pasteurianus NBRC 101655, эти бактерии принадлежат разным типам. Зато функции находки и исходного белка схожи: название находки - putative oxidoreductase, NAD-binding. Скорее всего они гомологи.
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q3AAM3 (Q3AAM3_CARHZ).
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
---|---|---|---|---|
Биологический процесс (Biological process) | GO:0008152 | metabolic process | метаболитический процесс | ISS |
Молекулярная функция (molecular function) | GO:0016491 | oxidoreductase activity | оксидоредуктазная активность | ISS |
Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
---|---|---|
ISS | Inferred from Sequence or structural Similarity | Данный код присваивается, если для аннотации было использовано несколько различных методов анализа последовательности (если какой-то конкретный, то уточняется какой именно - ISO, ISM или ISA), а также структурное сходство. |
Найденные термины в БД GO достаточно общие, и они не описывают в подробностях функцию находки, но с другой стороны это значит, что они большой долей вероятности применимы к моему белку (oxidoreductase FAD/NAD(P)-binding domain protein), то есть он участвует в метаболитических процессах и имеет оксидоредуктазную активность. Этот факт подкрепляется тем, что, как было уже выше сказано, находка достаточно гомологична моему белку, а также найденные термины имеют код типа достоверности ISS - достаточно хороший уровень достоверности.
© Агаева Зара, 2019