Геномное окружение. База данных GO.

Задание 1. Получение информации о COGe

Идентификатор белка: AMA61679.1
Autoinducer synthase [Bradyrhizobium sp. CCGE-LA001]
COG: COG3916 N-acyl-L-homoserine lactone synthetase [Signal transduction mechanisms];
Функциональная категория: T (Signal transduction mechanisms) // (Механизмы передачи сигнала)
E-value: 2.67e-44
Интервал, количество остатков в белке: 1-201 (219 aa)

Задание 2. Визуализация геномного окружения

Геномное окружение COG3916 было получено с помощью сервиса COGNAT со следующими параметрами:
COG: COG3916
Neighborhood Size: 9 (по умолчанию, близкие по расстоянию организмы)
Occurrence Threshold (%): 5 (начальные результаты показывали слишком мало генов из окружения и было сложно сделать какие-то выводы; отображаются гены окружения, с частотой встречаемости более 5%)
Taxonomy: Да

Ниже можно увидеть геномное окружение нашего белка; соответствие цветов стрелок COG-ам - в нижней части рисунка. Для определенных групп организмов характерно достаточно консервативное окружение, однако в целом окружение достаточно вариабельное. Часто рядом с COG3916 встречается COG4566 (болотно-зеленая стрелка), причем он может быть с двух сторон от нашего гена, или с одной (если слева, то еще и в разных направлениях). Этот ген - двухкомпонентный регулятор ответа семейства FixJ, состоящий из доменов REC и HTH. Он относится к той же функциональной категории, что и наш ген, а также участвует в транскрипции, что говорит об их возможной функциональной связи.
Также, достаточно часто встречаются COG5001 - белок сигнальной трансдукции (содержит мембранный домен, EAL и GGDEF домен), который также относится к функциональной группе нашего белка, (неоново-зеленая стрелка) и COG0476, относящийся к группе транспорта коэнзимов и метаболизма, (травяная стрелка), однако встречаются они у произвольных организмов (например, Nitrosococcus halophilus Nc4 или Methylomonas methanica MC09). Интересно, что везде, где происходит дупликация нашего гена, в ближайшем геномном окружении присутствует COG0476 (Halorhodospira halophila SL1 или Alkalilimnicola ehrlichii MLHE-1).
У Cyanobacteria и некоторых организмов Proteobacteria (напрмер, Phenylobacterium zucineum HLK1, Bradyrhizobium japonicum USDA 6 или Nitrobacter hamburgensis X14) при указанных нами параметрах нет информации об окружении (видимо, оно не является достаточно консервативным).

Задание 3. Отнесение Синтазы аутоиндуктора из Bradyrhizobium sp. CCGE-LA001 к терминам GO

Для отнесения исследуемого нами белка к терминам GO был использован сервис AMIGO. С помощью BLAST был произведен поиск гомологов; порог для E-value был выбран = 0.01.
Лучшая находка была обнаружена с P-value = 6.6e-11, это Синтаза аутоиндуктора из Ruegeria pomeroyi DSS-3, при этом функционально белок тот же самый. Ниже можно увидеть таблицы с отнесением данного белка к терминам GO и с расшифровкой кода достоверности из таблицы 1.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q5LR44 (Q5LR44_RUEPO).
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (biological process) GO:0009372 Quorum sensing system Чувство кворума ISS


Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS Inferred from Sequence or structural Similarity Используется всякий раз, когда основой для аннотации служит анализ последователльности вручную; требует от кураторов создания стабильного идентификатора. Если знаение With/From является геном или его продуктом, для него должны быть экспериментальные (или IC) доказательства. То-есть, вероятно, функциональность была подтверждена экспериментальными данными и расмотрением последовательности вручную.

© Бруман Софья, 2018