Функции. Онтологии базы данных GO
I. Знакомство с терминологией GO
1. Описание функции белка с помощью аннотации
Gene Ontology
Описание функции белка MLTA_Ecoli в соответствии с
GO-аннотацией
|
Онтология GO (название словаря)
|
Количество разных ассоциированных
терминов GO |
Функция белка
(краткое описание, близкое к тексту определения термина(ов)
GO |
Где? |
Cellular Component |
5
|
1. В липидном бислое, который образует внешние
слои клеточной оболочки.
2. Во внешней мембране грам-отрицательных бактерий
или определенных органелл таких как митохондрии
и хлоропласты.
3. В мембране
4. В плазматической мембране
5. Встроенный в плазматическую мембрану.- пронизывающий
хотя бы один фосфолипидный бислой плазматической
мембраны.
|
Зачем, для чего? |
Biological Process
|
4
|
1. Клеточное деление.
2. Химические реакции и пути образовывающие пептидогликаны,
любые классы гликоконъюгатов обнаруженных в клеточных
стенках бактерий
3. Продолжительное разрушение или регенирация пептидогликана
необходимое для поддержания клеточной стенки.
4. Процесс, который происходит на клеточном уровне
при котором происходит образование составных частей,
либо разбирание клеточной стенки.
|
Молекулярный механизм? |
Molecular Function
|
4
|
1. Лиазная активность - катализирует разрушение
связей С-С, C-O, C-N и других способов, отличных
от гидролиза и окисления, или, наоборот, добавление
какой-либо группы по двойной связи. Ферменты этого
класса отличаются от других тем, что с одной стороны
реакции стоят два субстрата, а с другой - один;
если в реакции участвует один субстрат, в результате
обрауется новая двойная связь или кольцо.
2. Гидролазная активность - катализирует гликолиз
любой О-гликозил связи.
3. Углерод-кислород лиазная активность - катализирует
разрушение углерод-кислородной связи, удалением
кислорода из полисахарида.
4. Литическая трансгликолизная активность - катализирует
специфическое разрезание гликозидной связи между
N-ацетилмурамовых и N-ацетилглюкозаминных остатков
в пептидогликане, с сопровождением образования 1,6-ангидро-N-ацетилмурамовых
остатков.
|
Специфичность? |
Molecular Function
|
3
|
1. Связывание с белками - селективное и нековалентное
взаимодействие с любым белком или белковым комплексом
(комплекс двух или более белков, может включать
другие небелковые молекулы).
2. Соединения с О-гликозилом.
3. Связывание с N-ацетилмурамовыми и N-ацетилглюкозаминными
остатками катализируемой реакции.
|
Описание терминов GO
GO ID выбранного термина
|
Список синонимов |
Список ближайших родительских
терминов GO с указанием типа связи |
Список ближайших дочерних
терминов GO с указанием типа связи |
GO:0000910
|
GO:0007104
GO:0016288
|
GO:0051301 : cell division (is_a)
|
Граф родительских,
дочерних терминов и терминов-сибсов
GO:0033205 : cell cycle cytokinesis
(is_a)
GO:0032506 : cytokinetic process (part_of)
GO:0032466 : negative regulation of cytokinesis
(negatively_regulates)
GO:0032467 : positive regulation of cytokinesis
(positively_regulates)
GO:0032465 : regulation of cytokinesis (regulates
)
|
GO:0016837 : |
-
|
GO:0016835 : carbon-oxygen
lyase activity (is_a) |
Граф родительских,
дочерних терминов и терминов-сибсов
GO:0033995 : anhydrosialidase
activity (is_a)
GO:0047486 : chondroitin ABC lyase activity
(is_a)
GO:0030341 : chondroitin AC lyase activity
(is_a)
GO:0033999 : chondroitin B lyase activity
(is_a)
GO:0047457 : exo-(1,4)-alpha-D-glucan lyase
activity (is_a)
GO:0033994 : glucuronan lyase activity (is_a)
GO:0047488 : heparin lyase activity (is_a)
GO:0015021 : heparin-sulfate lyase activity
(is_a)
GO:0030340 : hyaluronate lyase activity (is_a)
GO:0033997 : inulin fructotransferase (DFA-I-forming)
activity (is_a)
GO:0033998 : inulin fructotransferase (DFA-III-forming)
activity (is_a)
GO:0033996 : levan fructotransferase (DFA-IV-forming)
activity (is_a)
GO:0047487 : oligogalacturonide lyase activity
(is_a)
GO:0047489 : pectate disaccharide-lyase activity
(is_a)
GO:0030570 : pectate lyase activity (is_a)
GO:0047490 : pectin lyase activity (is_a)
GO:0047491 : poly(alpha-L-guluronate) lyase
activity (is_a)
GO:0045135 : poly(beta-D-mannuronate) lyase
activity (is_a)
GO:0046576 : rhamnogalacturonase B activity
(is_a)
GO:0047492 : xanthan lyase activity (is_a)
|
GO:0005886 |
bacterial inner membrane;
inner endospore membrane;
plasma membrane lipid bilayer
|
GO:0016020 : membrane (is_a)
|
Граф родительских,
дочерних терминов и терминов-сибсов
GO:0044459 : plasma membrane
part (part_of )
GO:0042383 : sarcolemma (is_a)
|
II. Оценка качества функциональной
аннотации белков в UniProt
Определение числа реальных и гипотетических
белков из Орангутангa:
На сайте NCBI был определен ранг таксона
Русское название: Орангутанг
Английское название: orangutang
Латинское название: Pongo
Ранг таксона: род
Taxonomy ID: 9599
Далее было изучено как проиндексированы
поле ProteinExistence БД UniProt для данного организма.
Поле ProteinExistence принимает 5 значений:
1: evidence at protein level (cуществование белка доказано
экспериментально);
2: evidence at transcript level (известны только соответствующие
транскрипты);
3: inferred from homology (гипотетический белок, предсказанный
по гомологии);
4: predicted (иные предсказанные гипотетические белки);
5: uncertain (существование белка не доказано).
Соотношение между реальными и гипотетическими белками
из Орангутангa (по данным UniProt)
|
Количество в UniProt |
Существование белка доказано экспериментально
|
9
|
Известны только соответствующие
транскрипты |
3776
|
Гипотетический белок, предсказан
по гомологии |
506
|
Иные предсказанные гипотетические
белки |
821
|
Как видно из таблицы количество белков,
существование которых было доказано эксперементально очень
мало. Существование большинства белков доказаны по транскриптам.
Около четвертой части белков доказаны гипотетически.
Определение качества функциональной аннотации
в UniProt
Коды экспериментального доказательства функции:
1. Inferred from Experiment (EXP) (получено из эксперимента);
2. Inferred from Direct Assay (IDA) (получено из прямого
анализа);
3. Inferred from Physical Interaction (IPI) (получено
из физического взаимодействия);
4. Inferred from Mutant Phenotype (IMP) (получено из мутантного
фенотипа);
5. Inferred from Genetic Interaction (IGI) (получено из
генетического взаимодействия);
6. Inferred from Expression Pattern (IEP) (получено из
модели экспрессии).
Для определения сколько из реальных белков
заданного таксона аннотированы по всем трем словарям GO
в SRS был сформулирован следующий запрос:
Organism name |
Pongo |
ProteinExistence |
1: evidence at protein level |
DBxref_ |
GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:) |
Однако поиск не дал результатов: Error:
request timeout.
III. Использование
GO для работы с массовыми данными
1. Получение выборки последовательностей
белков с заданной функциейПолучение выборки последовательностей
белков с заданной функцией
Функция: карбоксилирование
Перевод названия функции на английский: carboxylation
Выбранный термин: GO:0017187 peptidyl-glutamic acid carboxylation
Данный термин относится к онтологии biological process.
Был произведен поиск всех белков из заданного таксона
(Орангутан, Pongo) с таким идентификатором GO.
Запрос в SRS:
Organism name: Pongo
DBxref_ GO: GO:0017187
([uniprot-Taxonomy:pongo*] & [uniprot-DBxref_:GO:0017187*])
В результате поиска была найдена одна последовательность
Q5RF50.
2. Определение главной функции в большом
списке белков
В данном файле P0A935.txt,
содержащий список белков, c помощью программы GOstat
были определены белки с какими функциями доминируют.
В результате был получен список терминов GO в порядке
возрастания вероятности того, что частота термина близка
к его частоте в случайной выборке терминов (P-value >
0.01 не доверяем)
Термин GO |
P-value |
GO:0009254 |
5.92e-07 |
GO:0005886 |
3.41e-06 |
GO:0007047 |
5.77e-06 |
GO:0045229 |
5.77e-06 |
GO:0005515 |
1.47e-05 |
GO:0044262 |
0.000854 |
GO:0016798 |
0.000854 |
GO:0000270 |
0.00137 |
GO:0005975 |
0.0032 |
GO:0019867 |
0.00568 |
GO:0042597 |
0.00568 |
GO:0016998 |
0.00609 |
GO:0010382 |
0.00973 |
Место, где значение P-value резко возрастает,
является признаком порогового значения. Рассмотрим подробнее
термины до порогового значения:
Tермин GO
|
Oнтология GO
|
Функция
|
GO:0009254
|
biological process
|
регулятор пептидогликанов
|
GO:0005886
|
cellular component
|
плазматическая мембрана
|
GO:0007047
|
biological process
|
формирование клеточных стенок
|
GO:0045229
|
biological process
|
формирование внешних энкапсулированных
структур
|
GO:0005515
|
molecular function
|
связывание белков
|
Как видно в данной выборки белков одной из основных функций
является образование клеточной стенки и мембран.
Список терминов,ассоциированных с данным
мне белком MLTA_ECOLI:
Tермин GO
|
Oнтология GO
|
Функция |
GO:0009254
|
biological process
|
регулятор пептидогликанов |
GO:0007047
|
biological process
|
формирование клеточных стенок
|
GO:0045229
|
biological process
|
формирование внешних энкапсулированных
структур
|
GO:0005515
|
molecular function
|
связывание белков
|
GO:0016798
|
molecular function
|
катализ гидролиза любой гликозильной
связи |
GO:0000270
|
biological process
|
метаболический процесс пептидогликанов |
GO:0005975
|
biological process
|
метаболический процесс углеводородов |
GO:0019867
|
cellular component
|
внешняя мембрана |
Эти термины описывают функции присущие моему
белку; они разобраны более подробно в предыдущем задании.