Геномное окружение. База данных GO

1. Информация о КОГе

Идентификатор белка: ALX14857.1 (hemin ABC transporter substrate-binding protein, организм Burkholderia cepacia JBK9)

Идентификатор КОГа: COG4558

Величина e-value для отнесения белка к данному КОГу: 1.22e-79

Интервал: 29-300 остатки (всего 305 остатков)

Название КОГа и функциональная категория: ABC-type hemin transport system, periplasmic component [Inorganic ion transport and metabolism]

Транспортная система гемина ABC-типа, компонент периплазмы [категория: транспорт и метаболизм неорганических ионов]

2. Визуализация геномного окружения

При помощи программы COGNAT были получены изображения геномного окружения рассматриваемого КОГа. В центре находятся гены, относящиеся к нашему КОГу (COG4558), а справа и слева изображены их соседи (по 4 с каждой стороны, параметр Neighborhood Size = 9).

Выдача COGNAT, Occurrence Threshold = 25 % (покрашены КОГи, встреченные более, чем в 25% из рассмотренных организмов)

Выдача COGNAT, Occurrence Threshold = 75 %

Основное наблюдение состоит в том, что рассматриваемый КОГ зачастую (> 75% организмов) расположен рядом с КОГами ABC-type Fe3+-siderophore transport system, permease component (COG0609, покрашен коричневым) и ABC-type hemin transport system, ATPase component (COG4559, покрашен розовым). Причём чаще всего гены, относящиеся к этим КОГам, однонаправленны и идут друг за другом в определённом порядке. Помимо этого, в более четверти организмов поблизости найдены КОГи Putative heme degradation protein (COG3720, тёмно-коричневый) и Outer membrane receptor for ferrienterochelin and colicins (COG4771, голубой). Таким образом, геномное окружение в рассматриваемой группе белков достаточно консервативно: в большинстве организмов гены, отвечающие за транспорт железа, собраны в кассеты. Хотя, конечно, встречаются и бактерии, у которых в геномное окружение нашего КОГа вклиниваются и другие гены (например аминопептидаза в Salinibacter ruber M8).

3. Отнесение белка к терминам GO

Лучшая находка, выданная BLAST AmiGO, - белок Hemin ABC transporter, periplasmic hemin-binding protein HutB, принадлежащий бактерии Vibrio cholerae O1, p-value находки - 8.7e-24. Identities = 76/241 (31%), Positives = 113/241 (46%). Степень сходства белков свидетельствует о гомологии, хотя о близком родстве говорить не приходится. Бактерии Vibrio cholerae и Burkholderia cepacia филогенетически далеки друг от друга (первая относится к группе гамма-протеобактерий, а вторая - бета-протеобактерий).

Однако, несмотря на существенные различия в последовательностях, функционально мой белок и найденный при помощи BLAST AmiGO, судя по названию, одинаковы, поэтому, видимо, корректно переносить термины GO, относящиеся к находке, на мой белок. Термины, относящиеся к транспортёру гемина Vibrio cholerae, представлены в следующей таблице:

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q9KL36 (Q9KL36_VIBCH)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
biological process GO:0006810 transport транспорт IBA
biological process GO:0006826 iron ion transport транспорт ионов железа ISS
molecular function GO:0042626 ATPase activity, coupled to transmembrane movement of substances АТФазная активность, сопряжённая с переносом веществ через мембрану ISS
cellular component GO:0030288 outer membrane-bounded periplasmic space периплазматическое пространство под внешней мембраной IBA
molecular function GO:0036094 small molecule binding связывание малых молекул IBA

Обратим внимание на колонку "Код типа достоверности". В ней видим два значения - IBA и ISS. В таблице 2 приведена их расшифровка:

Таблица 2. Описание кодов достоверности, использованных в Таблице 1

Код типа достоверности Расшифровка кода типа достоверности Объяснение
IBA Inferred from Biological aspect of Ancestor Код присваивается, когда известно, что данное свойство присуще предковому белку (филогенетический подход к аннотации)
ISS Inferred from Sequence or structural Similarity Предсказание свойства основано на анализе схожести последовательности данного белка с другими белковыми последовательностями (в т.ч. могут использоваться данные о вторичной структуре). Для предсказания должно быть использовано несколько различных методов, измеряющих сходство последовательностей.

Нельзя сказать, что IBA и ISS - коды, свидетельствующие о высокой степени достоверности. Однако информация о консервативности геномного окружения говорит в пользу разумности приведённых терминов.


© Быкова Даша, 2019