Геномное окружение. База данных GO.

Получение информации о КОГе белка.
Для выполнения задания был взят белок из первого семестра (белок Е системы секреции II типа бактерии Gemmatimonas phototrophica, ссылка на страницу с описание белка)
Всего было обнаружено 5 КОГов, но они перекрывались, поэтому ниже приведён КОГ с наибольшим покрытием белка и с наименьшим E-value:
COG2804
E-value: 0
Interval: 71-612
Length: 613
Name:PulE, Type II secretory pathway ATPase GspE/PulE or T4P pilus assembly pathway ATPase PilB
Functional category:Cell motility, Intracellular trafficking, secretion, and vesicular transport, Extracellular structures
АТФаза GspE/PulE секреторного пути второго типа или АТФаза PilB пути сборки пилуса T4P (Клеточная подвижность, внутриклеточный транспорт, секреция и везикулярный транспорт, внеклеточные структуры)
Визуализация геномного окружения
Был проведён поиск по COGNAT (COmparative Gene Neighborhood Analysis Tool)
Параметры:
COG Identifier: COG2804
Neighborhood Size: 9 (по умолчанию)
Occurance threshold: 20% (по умолчанию)
Taxonomy: да
Было получено следующее изображение геномного окружения:
Изображение можно увидеть по ссылке
Большими и яркими зелёными стрелками отмечен наш КОГ (COG2804)
Синими - Type II secretory pathway, component PulF (COG1459)
Красными - Type II secretory pathway component GspD/PulD (secretin) (COG1450)
Маленькими зелёными стрелками - Tfp plus assemly protein FimT (COG4970)
Можно заметить, что у некоторых организмов ген, имеющий COG1450 инвертирован.
Геномное окружение не консервативно. Во-первых, присутствует уже отмеченная инверсия гена, отмеченного красной стрелки у некоторых организмов. Представленные организмы могут содержать все гены, содержащие COGи из перечисленных выше, а могут содержать только непосредственно наш ген, также COGи присутствуют в различных сочетаниях. Белки могут быть связаны функционально, так как все они участвуют в функционировании секреторных систем организмов.

Отнесение белка Е системы секреции II типа из бактерии Gemmatimonas phototrophica к терминам GO
С помощью AmiGo поиском BLAST был обнаружен белок с наименьшим P-value(5.7e-152): Type IV pilus biogenesis ATPase PilB из организма Geobacter sulfurreducens PCA). Этот белок является гомологом нашего белка у данного организма (напомню, что COG к которому относится наш белок называется Type II secretory pathway ATPase GspE/PulE or T4P pilus assembly pathway ATPase PilB).
Таблица 1. Термины GO, отнесённые к белку с идентификатором UniProtKB:Q74D28(Q74D28_GEOSL).
АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Биологоческий процесс(biological process) GO:0009297Pilus assemblyСборка пилусаISS
Молекулярная функция (molecular function)GO:0003674 molecular_function молкулярная функцияND

Таблица 2. Описание кодов достоверности, использованных в таблице 1.
Код типа достоверностиРасшифровка кода типа достоверностиОбъяснение
ISSInferred from Sequence or structural SimilarityКод ISS или его подкатегории используются в случаях ручного или основанного на анализе последовательностей подтверждения для аннотации.Также ISS используется для структурной схожести с экспериментально исследованными продуктами генов, например, с помощью кристаллографии, ядерного магнитного резонанса или компьютерного предсказания.
NDNo biological Data availableКод типа достоверности ND используется для аннотаций, в которых информация о молекулярной функции, биологическом процессе или клеточном компоненте гена или продукте гена, которая аннотируется, недоступна.


©Кондратенко Наталья, 2017