Gene Ontology |
|||||||||||||||||||||||||||||||||||||||
На главную | |||||||||||||||||||||||||||||||||||||||
Итак, я вернулась к работе с белком YP_006767025.1 (WP_014961570, UniProt - J9ZBY4_LEPFM) бактерии Leptospirillum ferriphilum ML-04, выданным мне в первом семестре. В этом практикуме я отнесу его к терминам базы данных Gene Ontology. Чтобы найти исследуемый белок в GO, я воспользовалась поиском BLAST в инструменте AmiGO c настройками по умолчанию. Выдача выглядела следующим образом: Лучшая находка - белок GSU_1894 (2-dehydro-3-deoxyphosphooctonate aldolase) организма Geobacter sulfurreducens PCA. Её p-value составил 3.1e-74. Конечно, это разные белки (3-deoxy-8-phosphooctulonate synthase и 2-dehydro-3-deoxyphosphooctonate aldolase), но они довольно сходны (здесь лежит парное выравнивание этих белков). Кстати, организмы, из которых взяты эти белки, очень далеко отстоят друг от друга: Geobacter относится к типу Proteobacteria, а Leptospirillum - к типу Nitrospirae. Затем я перешла на страницу белка GSU_1894 и, пользуясь информацией с вкадки 2 term assotiations, заполнила следующую таблицу: Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P61655 (KDSA_GEOSL)
В целом, в таблице содержится информация о различных аспектах белка, а также некоторые их атрибуты (идентификаторы и тип достоверности). Тип достоверности - это указание на то, каким путём была получена информация о данном белке и насколько можно ей доверять. В моём случае встретился только один код типа достоверности - ISS: Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Итак, аннотация белка была произведена вручную. Это говорит о высокой достоверности информации об этом белке. Теперь я опишу термин Molecular function исследуемого белка (термин GO:0008676). По этому термину доступна следующая информация (на соответствующей ему вкладке): Таблица 3. Основные свойства термина GO:0008676.
Вывод: по термину можно узнать много полезной информации. Например, предковые реакции или ферментативные активности, определение, синонимы и многое другое. А вот графическое представление предков данного термина (единственное доступное): Здесь нужно пояснить, что goslim (Go-slim) - это обрезанная версия GO-Ontology, дающая самые общие сведения об онтологии. Цветные прямоугольники внутри каждого термина - это организмы, в которых этот термин встречается как предок исследуемого термина (цветовой код справа). Разноцветные стрелки указывают тип отношений между терминами. Отмечу, что рисунок очень понятный: из него можно получить однозначную информацию о том, что за процесс в данный момент изучается, к какому типу относится и в каких организмах встречается. В целом, Gene Ontology, по моему мнению - база данных с удобным интерфейсом, содержащая достоверную информацию о генах и их метаболических путях, которую можно достаточно быстро получить. | |||||||||||||||||||||||||||||||||||||||
© Елена Очередько,2016. |