Функции. Онтологии базы данных GO

I. Знакомство с терминологией GO

1. Описание функции белка с помощью аннотации Gene Ontology

Описание функции белка MLTA_Ecoli в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где? Cellular Component
5

1. В липидном бислое, который образует внешние слои клеточной оболочки.
2. Во внешней мембране грам-отрицательных бактерий или определенных органелл таких как митохондрии и хлоропласты.
3. В мембране
4. В плазматической мембране
5. Встроенный в плазматическую мембрану.- пронизывающий хотя бы один фосфолипидный бислой плазматической мембраны.

Зачем, для чего?
Biological Process
4

1. Клеточное деление.
2. Химические реакции и пути образовывающие пептидогликаны, любые классы гликоконъюгатов обнаруженных в клеточных стенках бактерий
3. Продолжительное разрушение или регенирация пептидогликана необходимое для поддержания клеточной стенки.
4. Процесс, который происходит на клеточном уровне при котором происходит образование составных частей, либо разбирание клеточной стенки.

Молекулярный механизм?
Molecular Function
4

1. Лиазная активность - катализирует разрушение связей С-С, C-O, C-N и других способов, отличных от гидролиза и окисления, или, наоборот, добавление какой-либо группы по двойной связи. Ферменты этого класса отличаются от других тем, что с одной стороны реакции стоят два субстрата, а с другой - один; если в реакции участвует один субстрат, в результате обрауется новая двойная связь или кольцо.
2. Гидролазная активность - катализирует гликолиз любой О-гликозил связи.
3. Углерод-кислород лиазная активность - катализирует разрушение углерод-кислородной связи, удалением кислорода из полисахарида.
4. Литическая трансгликолизная активность - катализирует специфическое разрезание гликозидной связи между N-ацетилмурамовых и N-ацетилглюкозаминных остатков в пептидогликане, с сопровождением образования 1,6-ангидро-N-ацетилмурамовых остатков.

Специфичность?
Molecular Function
3

1. Связывание с белками - селективное и нековалентное взаимодействие с любым белком или белковым комплексом (комплекс двух или более белков, может включать другие небелковые молекулы).
2. Соединения с О-гликозилом.
3. Связывание с N-ацетилмурамовыми и N-ацетилглюкозаминными остатками катализируемой реакции.


Описание терминов GO

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
GO:0000910
GO:0007104
GO:0016288
GO:0051301 : cell division (is_a)

Граф родительских, дочерних терминов и терминов-сибсов

GO:0033205 : cell cycle cytokinesis (is_a)
GO:0032506 : cytokinetic process (part_of)
GO:0032466 : negative regulation of cytokinesis (negatively_regulates)
GO:0032467 : positive regulation of cytokinesis (positively_regulates)
GO:0032465 : regulation of cytokinesis (regulates )

GO:0016837 :
-
GO:0016835 : carbon-oxygen lyase activity (is_a)

Граф родительских, дочерних терминов и терминов-сибсов

GO:0033995 : anhydrosialidase activity (is_a)
GO:0047486 : chondroitin ABC lyase activity (is_a)
GO:0030341 : chondroitin AC lyase activity (is_a)
GO:0033999 : chondroitin B lyase activity (is_a)
GO:0047457 : exo-(1,4)-alpha-D-glucan lyase activity (is_a)
GO:0033994 : glucuronan lyase activity (is_a)
GO:0047488 : heparin lyase activity (is_a)
GO:0015021 : heparin-sulfate lyase activity (is_a)
GO:0030340 : hyaluronate lyase activity (is_a)
GO:0033997 : inulin fructotransferase (DFA-I-forming) activity (is_a)
GO:0033998 : inulin fructotransferase (DFA-III-forming) activity (is_a)
GO:0033996 : levan fructotransferase (DFA-IV-forming) activity (is_a)
GO:0047487 : oligogalacturonide lyase activity (is_a)
GO:0047489 : pectate disaccharide-lyase activity (is_a)
GO:0030570 : pectate lyase activity (is_a)
GO:0047490 : pectin lyase activity (is_a)
GO:0047491 : poly(alpha-L-guluronate) lyase activity (is_a)
GO:0045135 : poly(beta-D-mannuronate) lyase activity (is_a)
GO:0046576 : rhamnogalacturonase B activity (is_a)
GO:0047492 : xanthan lyase activity (is_a)

GO:0005886
bacterial inner membrane;
inner endospore membrane;
plasma membrane lipid bilayer
GO:0016020 : membrane (is_a)

Граф родительских, дочерних терминов и терминов-сибсов

GO:0044459 : plasma membrane part (part_of )
GO:0042383 : sarcolemma (is_a)

II. Оценка качества функциональной аннотации белков в UniProt

Определение числа реальных и гипотетических белков из Орангутангa:
На сайте NCBI был определен ранг таксона
Русское название: Орангутанг
Английское название: orangutang
Латинское название: Pongo
Ранг таксона: род
Taxonomy ID: 9599

Далее было изучено как проиндексированы поле ProteinExistence БД UniProt для данного организма. Поле ProteinExistence принимает 5 значений:
1: evidence at protein level (cуществование белка доказано экспериментально);
2: evidence at transcript level (известны только соответствующие транскрипты);
3: inferred from homology (гипотетический белок, предсказанный по гомологии);
4: predicted (иные предсказанные гипотетические белки);
5: uncertain (существование белка не доказано).

Соотношение между реальными и гипотетическими белками из Орангутангa (по данным UniProt)

  Количество в UniProt
Существование белка доказано экспериментально
9
Известны только соответствующие транскрипты
3776
Гипотетический белок, предсказан по гомологии
506
Иные предсказанные гипотетические белки
821

Как видно из таблицы количество белков, существование которых было доказано эксперементально очень мало. Существование большинства белков доказаны по транскриптам. Около четвертой части белков доказаны гипотетически.

Определение качества функциональной аннотации в UniProt

Коды экспериментального доказательства функции:
1. Inferred from Experiment (EXP) (получено из эксперимента);
2. Inferred from Direct Assay (IDA) (получено из прямого анализа);
3. Inferred from Physical Interaction (IPI) (получено из физического взаимодействия);
4. Inferred from Mutant Phenotype (IMP) (получено из мутантного фенотипа);
5. Inferred from Genetic Interaction (IGI) (получено из генетического взаимодействия);
6. Inferred from Expression Pattern (IEP) (получено из модели экспрессии).

Для определения сколько из реальных белков заданного таксона аннотированы по всем трем словарям GO в SRS был сформулирован следующий запрос:

Organism name Pongo
ProteinExistence 1: evidence at protein level
DBxref_ GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:)

 

 

 

Однако поиск не дал результатов: Error: request timeout.

III. Использование GO для работы с массовыми данными

1. Получение выборки последовательностей белков с заданной функциейПолучение выборки последовательностей белков с заданной функцией

Функция: карбоксилирование
Перевод названия функции на английский: carboxylation
Выбранный термин: GO:0017187 peptidyl-glutamic acid carboxylation
Данный термин относится к онтологии biological process.
Был произведен поиск всех белков из заданного таксона (Орангутан, Pongo) с таким идентификатором GO.

Запрос в SRS:
Organism name: Pongo
DBxref_ GO: GO:0017187

([uniprot-Taxonomy:pongo*] & [uniprot-DBxref_:GO:0017187*])

В результате поиска была найдена одна последовательность Q5RF50.

2. Определение главной функции в большом списке белков

В данном файле P0A935.txt, содержащий список белков, c помощью программы GOstat были определены белки с какими функциями доминируют.
В результате был получен список терминов GO в порядке возрастания вероятности того, что частота термина близка к его частоте в случайной выборке терминов (P-value > 0.01 не доверяем)

Термин GO P-value
GO:0009254 5.92e-07
GO:0005886 3.41e-06
GO:0007047 5.77e-06
GO:0045229 5.77e-06
GO:0005515 1.47e-05
GO:0044262 0.000854
GO:0016798 0.000854
GO:0000270 0.00137
GO:0005975 0.0032
GO:0019867 0.00568
GO:0042597 0.00568
GO:0016998 0.00609
GO:0010382 0.00973

 

 

 

 

 

 

 

 

 

Место, где значение P-value резко возрастает, является признаком порогового значения. Рассмотрим подробнее термины до порогового значения:

Tермин GO
Oнтология GO
Функция
GO:0009254
biological process
регулятор пептидогликанов
GO:0005886
cellular component
плазматическая мембрана
GO:0007047
biological process
формирование клеточных стенок
GO:0045229
biological process
формирование внешних энкапсулированных структур
GO:0005515
molecular function
связывание белков

 

 

 

 


Как видно в данной выборки белков одной из основных функций является образование клеточной стенки и мембран.

Список терминов,ассоциированных с данным мне белком MLTA_ECOLI:

Tермин GO
Oнтология GO
Функция
GO:0009254
biological process
регулятор пептидогликанов
GO:0007047
biological process
формирование клеточных стенок
GO:0045229
biological process
формирование внешних энкапсулированных структур
GO:0005515
molecular function
связывание белков
GO:0016798
molecular function
катализ гидролиза любой гликозильной связи
GO:0000270
biological process
метаболический процесс пептидогликанов
GO:0005975
biological process
метаболический процесс углеводородов
GO:0019867
cellular component
внешняя мембрана

 

 

 

 

 

 

 

Эти термины описывают функции присущие моему белку; они разобраны более подробно в предыдущем задании.