Gene Ontology

На главную

Итак, я вернулась к работе с белком YP_006767025.1 (WP_014961570, UniProt - J9ZBY4_LEPFM) бактерии Leptospirillum ferriphilum ML-04, выданным мне в первом семестре. В этом практикуме я отнесу его к терминам базы данных Gene Ontology.
Чтобы найти исследуемый белок в GO, я воспользовалась поиском BLAST в инструменте AmiGO c настройками по умолчанию. Выдача выглядела следующим образом:

Рис.1. Первые четыре находки в выдаче BLAST AmiGO


Лучшая находка - белок GSU_1894 (2-dehydro-3-deoxyphosphooctonate aldolase) организма Geobacter sulfurreducens PCA. Её p-value составил 3.1e-74. Конечно, это разные белки (3-deoxy-8-phosphooctulonate synthase и 2-dehydro-3-deoxyphosphooctonate aldolase), но они довольно сходны (здесь лежит парное выравнивание этих белков). Кстати, организмы, из которых взяты эти белки, очень далеко отстоят друг от друга: Geobacter относится к типу Proteobacteria, а Leptospirillum - к типу Nitrospirae.
Затем я перешла на страницу белка GSU_1894 и, пользуясь информацией с вкадки 2 term assotiations, заполнила следующую таблицу:

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P61655 (KDSA_GEOSL)
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0019294 keto-3-deoxy-D-manno-octulosonic acid biosynthetic process биосинтез кето-3-дезокси-D-маннооктулосоновой кислоты ISS
Функция (Molecular function) GO:0008676 3-deoxy-8-phosphooctulonate synthase activity 3-дезокси-8-фосфооктулонатсинтазная активность ISS


В целом, в таблице содержится информация о различных аспектах белка, а также некоторые их атрибуты (идентификаторы и тип достоверности). Тип достоверности - это указание на то, каким путём была получена информация о данном белке и насколько можно ей доверять. В моём случае встретился только один код типа достоверности - ISS:

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности Расшифровка кода Объяснение
ISS Inferred from sequence or structure similarity Этот код используется в тех случаях, когда аннотация производилась вручную на основе структурной гомологии либо гомологии по последовательности


Итак, аннотация белка была произведена вручную. Это говорит о высокой достоверности информации об этом белке. Теперь я опишу термин Molecular function исследуемого белка (термин GO:0008676). По этому термину доступна следующая информация (на соответствующей ему вкладке):

Таблица 3. Основные свойства термина GO:0008676.
Свойство Значение
Идентификатор (Accession) GO:0008676
Название (Name) 3-deoxy-8-phosphooctulonate synthase activity
Аспект онтологии (Ontology) Молекулярная функция (Molecular function)
Синонимы (Synonyms)
2-dehydro-3-deoxy-D-octonate-8-phosphate D-arabinose-5-phosphate-lyase (pyruvate-phosphorylating) activity
2-dehydro-3-deoxy-phosphooctonate aldolase activity
2-dehydro-3-deoxyphosphooctonate aldolase activity
2-keto-3-deoxy-8-phosphooctonic synthetase activity
3-deoxy-D-manno-octulosonate-8-phosphate synthase activity
3-deoxy-D-manno-octulosonic acid 8-phosphate synthetase activity
3-deoxy-D-mannooctulosonate-8-phosphate synthetase activity
3-deoxyoctulosonic 8-phosphate synthetase activity
KDO-8-P synthase activity
KDO-8-phosphate synthetase activity
KDOP synthase activity
phospho-2-keto-3-deoxyoctonate aldolase activity
phosphoenolpyruvate:D-arabinose-5-phosphate C-(1-carboxyvinyl)transferase (phosphate-hydrolysing, 2-carboxy-2-oxoethyl-forming)
Определение (Definition) Catalysis of the reaction: D-arabinose 5-phosphate + H(2)O + phosphoenolpyruvate = 8-phospho-3-deoxy-D-manno-oct-2-ulosonate + 2 H(+) + phosphate.
Комментарий (Comment) Note that this function was formerly EC:4.1.2.16.
Число родителей (из них - логически определённых) 4 (4)
Число потомков (из них - логически определённых) 0


Вывод: по термину можно узнать много полезной информации. Например, предковые реакции или ферментативные активности, определение, синонимы и многое другое.
А вот графическое представление предков данного термина (единственное доступное):

Рис.2. Графическое представление термина GO:0008676


Здесь нужно пояснить, что goslim (Go-slim) - это обрезанная версия GO-Ontology, дающая самые общие сведения об онтологии. Цветные прямоугольники внутри каждого термина - это организмы, в которых этот термин встречается как предок исследуемого термина (цветовой код справа). Разноцветные стрелки указывают тип отношений между терминами. Отмечу, что рисунок очень понятный: из него можно получить однозначную информацию о том, что за процесс в данный момент изучается, к какому типу относится и в каких организмах встречается.
В целом, Gene Ontology, по моему мнению - база данных с удобным интерфейсом, содержащая достоверную информацию о генах и их метаболических путях, которую можно достаточно быстро получить.