Gene Ontology

Задание 1. Отнесение белка L-rhamnose isomerase к терминам GO

В этом практикуме я продолжаю работу с выданным мне в первом семестре белком L-rhamnose isomerase бактерии Bacteroides thetaiotaomicron VPI-5482 (UniProt AC Q8A1A2, RefSeq NP_812675.1, локус гена BT_3764). В этом практикуме я отнесу его к терминам базы данных Gene Ontology.
В поисках белка я воспользовался поиском BLAST в инструменте AmiGO c настройками по умолчанию, по UniProt AC. Выдача состояла из одной находки:


Рис.1. Выдача поиска BLAST

Эта находка - белок L-rhamnose isomerase бактерии Escherichia coli K-12, её p-value 3.4e-125. Это тот же белок, и они довольно сходны по последовательностям. Здесь можно скачать парное выравнивание двух белков. Перейдя на страницу белка, я открыл вкладку 9 term assotiation и, пользуясь найденной информацией, заполнил таблицу:



Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P32170 (RHAA_ECOLI)
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс (Biological process) GO:0019324 L-lyxose metabolic process Метаболизм L-ликсозы IEP
Биологический процесс (Biological process) GO:0019301 rhamnose catabolic process Катаболизм рамнозы IEA, IMP
Биологический процесс (Biological process) GO:0019299 rhamnose metabolic process Метаболизм рамнозы IEA
Клеточная локализация (Сellular component) GO:0005737 cytoplasm Цитоплазма IEA
Функция (Molecular function) GO:0042802 identical protein binding Связывание идентичного белка IDA
Функция (Molecular function) GO:0016853 isomerase activity Изомеразная активность IEA
Функция (Molecular function) GO:0008740 L-rhamnose isomerase activity Изомеризация L-рамнозы IEA, IDA
Функция (Molecular function) GO:0030145 manganese ion binding Связывание иона магния IEA
Функция (Molecular function) GO:0046872 metal ion binding Связывание иона металла IEA

В таблице содержится информация о свойствах данного белка и их атрибуты GO - идентификаторы и тип достоверности. Тип достоверности - это указание на то, каким путём была получена информация о данном белке и насколько можно ей доверять. Встречающиеся в таблице 1 коды типа достоверности того или иного свойства описаны в таблице 2:



Таблица 2. Описание кодов достоверности, использованных в Таблице 1 (в данном случае 4 кода).
Код типа достоверности Расшифровка кода Объяснение
IEP Inferred from Expression Pattern Код для случаев, когда свойства белка выводят, изучая его время, место или количество экспрессии.
IEA Inferred from Electronic Annotation Данный код используется для аннотаций, построенных на вычислениях или автоматичесом переносе данных из других баз данных; куратор в процессе не учавствует. Если аннотация не была рецензирована спустя год, она будет удалена.
IMP Inferred from Mutant Phenotype Этот код употребялется в том случае, если функция, процесс или локализация выявлялись на основе сравнения различий мутантных фенотипов, разных аллелей гена или полиморфизмов.
IDA Inferred from Direct Assay Этот код используется в тех случаях, когда аннотация производилась вручную на основе исследования, проведенного для определения свойства и соотнесения его с терминами GO.

Итак, большая часть аннотации белка была произведена автоматически, и потому не может заслуживать особого доверия. Однако ключевая особенность белка - его каталитическая активность по изомеризации L-рамнозы - была определена исходя из эксперементальных данных, что говорит о высокой достоверности именно этой функции (термин GO:0008740). Его я и буду описывать при выполнении следующего задания.



Задание 2. Описание термина GO:0008740



Таблица 3. Основные свойства термина GO:0008740.
Свойство Значение
Идентификатор (Accession) GO:0008740
Название (Name) L-rhamnose isomerase activity
Аспект онтологии (Ontology) Молекулярная функция (Molecular function)
Синонимы (Synonyms) L-rhamnose aldose-ketose-isomerase activity,
L-rhamnose ketol-isomerase activity,
rhamnose isomerase activity
Определение (Definition) Catalysis of the reaction: L-rhamnose = L-rhamnulose.
Source: EC:5.3.1.14
Комментарий (Comment) None
Число родителей (из них - логически определённых) 7 (6)
Число потомков (из них - логически определённых) 0

Как выяснилось, по термину можно узнать много полезной информации: предковые реакции, ферментативные активности, определение, синонимы и так далее. Графическое представление предков данного термина представлено на рис.2:


Рис.2. Графическое представление термина GO:0008740

Go-slim, он же goslim - это обрезанная версия GO-Ontology, дающая самые общие сведения об онтологии: цветные прямоугольники внутри каждого термина - это организмы, в которых этот термин встречается как предок исследуемого термина (цветовой код справа), а разноцветные стрелки указывают тип отношений между терминами. Рисунок довольно информативен, и позволяет получить большой объём информации об исследуемом процессе.

На мой взгляд, база Gene Ontology удобна благодаря своему дружелюбному интерфейсу и большому количеству достоверной информации, которую можно быстро получить и систематизировать.



Назад к странице семестров

© Andrew Sigorskih,2016.