Учебный сайт Сергея Пушкарева

Навигация по сайту:

Геномное окружение. База данных GO

Получение информации о КОГе, к которому относится белок

Будем анализировать белок ALV08439.1 из далекого первого семестра. С помощью CDD получили, что наш белок относится к COG4558 c e-value 3.41e-76. Данный COG обнаруживается в белке с 11 по 294 остаток (при длине самого белка в 298 остаток). COG4558 называется "ABC-type hemin transport system, periplasmic component" и имеет категорию P (Inorganic ion transport and metabolism) или, говоря по-русски, "Переплазматическая компонента транспортной системы гемина по типу ABC", категория "Транспорт и метаболизм неорганических ионов".

Визуализация геномного окружения

С помощью программы COGNAT получим геномное окружение нашего COG-a в 711 прокариотических геномах. Параметры запуска: COG: COG4558, Neighborhood Size: 11, Occurrence Threshold (%): 20, Taxonomy: Да.

Использующаяся легенда:

Геномное окружение COG4558.

Ссылка на файл выдачи COGNAT. (На сайте ничего не видно). Как видно из геномного окружения, у некоторых бактерий (например Aromatoleum aromaticum EbN1) отсутсвуют белки принадлежащие нашему COG-у. В целом, можно сказать, что геномное окружение достаточно консервативное: почти во всех геномах присутсвуют белки из COG0609 и COG4559 downstream от нашего COG-a. Upstream примерно в половине геномов встречаются белки COG4771. Тоже примерно в половине бактерий чаще upstream, но иногда и downstream встречается COG3720. Между COG-ами безусловно есть функциональная связь, так как все они участвуют в метаболизме соединений железа.

Отнесение белка ALV08439.1 из Roseateles depolymerans KCTC 42856 к терминам GO

Наиболее похожим на наш оказался белок VC_A0913 из организма Vibrio cholerae O1 biovar El Tor str. N16961. Полное название — Hemin ABC transporter, periplasmic hemin-binding protein HutB. Похоже на ALV08439.1. Что касается цифр, то P-value находки составило P = 1.4e-32, что вполне достаточно, чтобы считать его гомологом. Интересно, что при включенном "Blast filter" часть последовательности запроса замаскировалась буквой Х. При отключении этого фильтра получаем для этого же VC_A0913 P-value = 8.9e-38 за счет дополнительных match-ей в этом регионе. Наверное замаскированный участок был участком малой сложности.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot Q9KL36 (Q9KL36_VIBCH).

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
biological process GO:0006826 Iron ion transport Транспорт ионов железа ISS
biological process GO:0006810 Transport Транспорт IBA, With PANTHER:PTN001254105 GO
cellular component GO:0030288 outer membrane-bounded periplasmic space Периплазматическое пространство, ограниченное внешней мембраной (пространство между внутренней и внешней мембраной G(-) бактерий) IBA, With PANTHER:PTN001254105 GO
molecular function GO:0042626 ATPase activity, coupled to transmembrane movement of substances АТФазная активность, сопряженная с перемещением веществ через мембрану ISS
molecular function GO:0036094 small molecule binding Связывание малых молекул IBA, With PANTHER:PTN001254105 GO

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.

Код типа достоверности Расшифровка кода типа достоверности Объяснение
ISS International space station
Inferred from Sequence or structural Similarity
ISS упортребляется, когда был произведен компьютерный анализ последовательности или структуры. Отличие от IEA в том, что эта аннотация была просмотрена человеком. Также для ISS необходим анализ несколькими методами. Если для аннотации использовался только один метод, то в таком случае используется одна из подкатегорий ISS: ISA, ISM, and ISO.
IBA Inferred from Biological aspect of Ancestor IBA используется, когда на один белок переносится аннотация другого на основании их филогенетического сходства. При этом обязательно указывается идентификатор узла на филогенетическом дереве соответствующего семейства белков (например PANTHER:PTN001254105).

Таким образом, в этом практикуме мы идентифицировали кластер ортологичных генов, куда входит наш белок, посмотрели на геномное окружение ортологов этого гена в разных организмах и попытались найти термины GO для нашего белка. Найдя в базе данных GO белок наиболее похожий на рассматриваемый, получили термины GO для рассматриваемого белка. Термины перечислены в таблице 1, расшифровка типов достоверности в таблице 1 представлена в таблице 2.

© Пушкарев Сергей, 2019