Gene Ontology | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание 1. Отнесение белка L-rhamnose isomerase к терминам GO В этом практикуме я продолжаю работу с выданным мне в первом семестре белком L-rhamnose isomerase бактерии Bacteroides thetaiotaomicron VPI-5482
(UniProt AC Q8A1A2, RefSeq NP_812675.1, локус гена BT_3764).
В этом практикуме я отнесу его к терминам базы данных Gene Ontology. Эта находка - белок L-rhamnose isomerase бактерии Escherichia coli K-12, её p-value 3.4e-125. Это тот же белок, и они довольно сходны по последовательностям. Здесь можно скачать парное выравнивание двух белков. Перейдя на страницу белка, я открыл вкладку 9 term assotiation и, пользуясь найденной информацией, заполнил таблицу: Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P32170 (RHAA_ECOLI)
В таблице содержится информация о свойствах данного белка и их атрибуты GO - идентификаторы и тип достоверности. Тип достоверности - это указание на то, каким путём была получена информация о данном белке и насколько можно ей доверять. Встречающиеся в таблице 1 коды типа достоверности того или иного свойства описаны в таблице 2: Таблица 2. Описание кодов достоверности, использованных в Таблице 1 (в данном случае 4 кода).
Итак, большая часть аннотации белка была произведена автоматически, и потому не может заслуживать особого доверия. Однако ключевая особенность белка - его каталитическая активность по изомеризации L-рамнозы - была определена исходя из эксперементальных данных, что говорит о высокой достоверности именно этой функции (термин GO:0008740). Его я и буду описывать при выполнении следующего задания. Задание 2. Описание термина GO:0008740 Таблица 3. Основные свойства термина GO:0008740.
Как выяснилось, по термину можно узнать много полезной информации: предковые реакции, ферментативные активности, определение, синонимы и так далее. Графическое представление предков данного термина представлено на рис.2: Go-slim, он же goslim - это обрезанная версия GO-Ontology, дающая самые общие сведения об онтологии: цветные прямоугольники внутри каждого термина - это организмы, в которых этот термин встречается как предок исследуемого термина (цветовой код справа), а разноцветные стрелки указывают тип отношений между терминами. Рисунок довольно информативен, и позволяет получить большой объём информации об исследуемом процессе. На мой взгляд, база Gene Ontology удобна благодаря своему дружелюбному интерфейсу и большому количеству достоверной информации, которую можно быстро получить и систематизировать. Назад к странице семестров | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Andrew Sigorskih,2016. |