Геномное окружение. База данных GO
1. Информация о КОГе
Идентификатор белка: ALX14857.1 (hemin ABC transporter substrate-binding protein, организм Burkholderia cepacia JBK9)
Идентификатор КОГа: COG4558
Величина e-value для отнесения белка к данному КОГу: 1.22e-79
Интервал: 29-300 остатки (всего 305 остатков)
Название КОГа и функциональная категория: ABC-type hemin transport system, periplasmic component [Inorganic ion transport and metabolism]
Транспортная система гемина ABC-типа, компонент периплазмы [категория: транспорт и метаболизм неорганических ионов]
2. Визуализация геномного окружения
При помощи программы COGNAT были получены изображения геномного окружения рассматриваемого КОГа. В центре находятся гены, относящиеся к нашему КОГу (COG4558), а справа и слева изображены их соседи (по 4 с каждой стороны, параметр Neighborhood Size = 9).
Выдача COGNAT, Occurrence Threshold = 75 %
Основное наблюдение состоит в том, что рассматриваемый КОГ зачастую (> 75% организмов) расположен рядом с КОГами ABC-type Fe3+-siderophore transport system, permease component (COG0609, покрашен коричневым) и ABC-type hemin transport system, ATPase component (COG4559, покрашен розовым). Причём чаще всего гены, относящиеся к этим КОГам, однонаправленны и идут друг за другом в определённом порядке. Помимо этого, в более четверти организмов поблизости найдены КОГи Putative heme degradation protein (COG3720, тёмно-коричневый) и Outer membrane receptor for ferrienterochelin and colicins (COG4771, голубой). Таким образом, геномное окружение в рассматриваемой группе белков достаточно консервативно: в большинстве организмов гены, отвечающие за транспорт железа, собраны в кассеты. Хотя, конечно, встречаются и бактерии, у которых в геномное окружение нашего КОГа вклиниваются и другие гены (например аминопептидаза в Salinibacter ruber M8).
3. Отнесение белка к терминам GO
Лучшая находка, выданная BLAST AmiGO, - белок Hemin ABC transporter, periplasmic hemin-binding protein HutB, принадлежащий бактерии Vibrio cholerae O1, p-value находки - 8.7e-24. Identities = 76/241 (31%), Positives = 113/241 (46%). Степень сходства белков свидетельствует о гомологии, хотя о близком родстве говорить не приходится. Бактерии Vibrio cholerae и Burkholderia cepacia филогенетически далеки друг от друга (первая относится к группе гамма-протеобактерий, а вторая - бета-протеобактерий).
Однако, несмотря на существенные различия в последовательностях, функционально мой белок и найденный при помощи BLAST AmiGO, судя по названию, одинаковы, поэтому, видимо, корректно переносить термины GO, относящиеся к находке, на мой белок. Термины, относящиеся к транспортёру гемина Vibrio cholerae, представлены в следующей таблице:
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q9KL36 (Q9KL36_VIBCH)
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
biological process | GO:0006810 | transport | транспорт | IBA |
biological process | GO:0006826 | iron ion transport | транспорт ионов железа | ISS |
molecular function | GO:0042626 | ATPase activity, coupled to transmembrane movement of substances | АТФазная активность, сопряжённая с переносом веществ через мембрану | ISS |
cellular component | GO:0030288 | outer membrane-bounded periplasmic space | периплазматическое пространство под внешней мембраной | IBA |
molecular function | GO:0036094 | small molecule binding | связывание малых молекул | IBA |
Обратим внимание на колонку "Код типа достоверности". В ней видим два значения - IBA и ISS. В таблице 2 приведена их расшифровка:
Таблица 2. Описание кодов достоверности, использованных в Таблице 1
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
IBA | Inferred from Biological aspect of Ancestor | Код присваивается, когда известно, что данное свойство присуще предковому белку (филогенетический подход к аннотации) |
ISS | Inferred from Sequence or structural Similarity | Предсказание свойства основано на анализе схожести последовательности данного белка с другими белковыми последовательностями (в т.ч. могут использоваться данные о вторичной структуре). Для предсказания должно быть использовано несколько различных методов, измеряющих сходство последовательностей. |
Нельзя сказать, что IBA и ISS - коды, свидетельствующие о высокой степени достоверности. Однако информация о консервативности геномного окружения говорит в пользу разумности приведённых терминов.
© Быкова Даша, 2019