Функции. Онтологии базы данных GO.

1.Знакомство с терминологией GO

1.1 Для определения функции белка ADIA_ECOLI воспользуемся БД UniProt. Перейдём по ссылке "Complete GO annotation..." .

А теперь оформим полученные данные в таблице:

Описание функции белка ADIA_ECOLI в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где? Cellular Component
2

1. GO:0005737 Обнаружен в цитоплазме.

2. GO:0005829 Обнаружен в цитозоле.

Зачем, для чего? Biological Process
3

1. GO:0051454 Повышение внутриклеточного pH. Процесс, при котором повышается внутриклеточное значение pH, измеряемое концентрацией ионов водорода.

2. GO:0006520 Химические реакции и пути метаболизма,включающие в себя аминокислоты и органические кислоты,содержащие одну и более амино-группу в качестве заместителя.

3. GO:0001101 Изменение состояния или активности клетки или организма в целом (секреция,движение,экспрессия генов,синтез ферментов) как результат действия кислот.

Молекулярный механизм? Molecular Function
3

1. GO:0016831 Карбокси-лиазная активность. Катализ негидролитического присоединения или отщепления карбоксильной группы по отношению к веществу.

2. GO:0003824 Каталитическая активность. Катализ биохимических реакций при физиологических температурах. В биологических каталитических реакциях,реагенты,известные как субстраты,катализируются естественными высокомолекулярными соединениями,называемыми ферментами. Ферменты содержат специфические сайты связывания для субстратов,и обычно в основном или полностью состоят из белка,и иногда РНК,обладающей также ферментативной активностью (рибозим).

3. GO:0016829 Лиазная активность. Каталитическое расщепление связей C-C, C-O, C-N и других связей в результате окисления либо гидролиза, либо присоединения группы к двойной связи. Отличаются от других ферментов тем, что участвующие 2 субстрата в реакции,один отвечает за протекание реакции в одном направлении,а другой-в обратном.

Специфичность? Molecular Function  
2
 1. GO:0008792 Аргинин-декарбоксилазная активность. Катализ реакции: L-arginine = agmatine + CO2

2. GO:0030170 Пиридоксаль-фосфатазное связывание. Не ковалентное селективное взаимодействие с пиридоксаль-5'-фосфатом, 3-гидрокси-5-(гидроксиметил)-2-метил 4-пиридин карбоксил-5'-фосфат ; биологически активная форма витамина B6.

 

Итак, белок ADIA_ECOLI,согласно функциональной аннотации GO, обладает лиазной активностью. Специфика фермента

заключается в том,что он связывается в основном с пиридоксаль-5'-фосфатом,и обладает аргинин-декарбоксилазной

активностью.

1.2 Для подробного описания выберем 3 термина GO по одному из каждого словаря:

    Описание терминов GO

    GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
     

    GO:0051454

    Biological Process

    cell pH elevation

    cellular alkalinization

    elevation of cellular pH

    intracellular alkalinization

    pH elevation in cell

    GO:0045852 - Процессы,в которых повышается pH в организме,части организма или клетке;измеряется концентрацией ионов водорода. Связь:is a

    GO:0051453 - Процессы, в которых регулируется внутреннее значение pH в клетке. Связь:is a

    GRAPHICAL VIEW

     
    GO:0016829

    Molecular Function

    other lyase activity  

    GO:0003824 - Катализ биохимических реакций при физиологических температуратурах. Связь:is a

    GRAPHICAL VIEW

     
     

    GO:0005829

    Cellular Component

     -
     

    GO:0044444 - Часть содержимого клетки,за исключением ядра и плазматической мембраны,но включая другие субклеточные структуры. Связь:is a

    GO:0044445

    Связь:part of

    GRAPHICAL VIEW

 

2. Оценка качества функциональной аннотации белка ADIA_ECOLI в UniProt

2.1 Определение числа реальных и гипотетических белков из таксона "морская свинка".

Название таксона на русском на латинском на английском
  морская свинка Cavia porcellus Domestic guinea pig

Ранг таксона - ВИД.

NCBI_TaxId (идентификатор) - 10141. 

Проведём запросы подобного вида для каждой аннотации поля ProteinExistence.

И полученные данные оформим в виде таблицы:

Соотношение между реальными и гипотетическими белками из
Cavia porcellus (морской свинки) по данным UniProt

  Количество в UniProt
Существование белка доказано экспериментально
94
Известны только соответствующие транскрипты
537
Гипотетический белок, предсказан по гомологии
103
Иные предсказанные гипотетические белки
69

Что ж, можно сказать,что основная часть белков известна по транскриптам.

К сожалению, экспериментально доказанных белков оказалось не так уж много.

 

2.2 Определение качества функциональной аннотации в UniProt

Коды экспериментального доказательства функции:

EXP: Inferred from Experiment

IDA: Inferred from Direct Assay

IPI: Inferred from Physical Interaction

IMP: Inferred from Mutant Phenotype

IGI: Inferred from Genetic Interaction

IEP: Inferred from Expression Pattern

Одним запросом по srs необходимо получить список белков из морской свинки, у которых встречается хотя бы один раз хотя бы

один из кодов экспериментального доказательства функции, и которые аннотированы по всем трем словарям GO.

К сожалению,поставленный запрос не дал желаемых результатов:

 

3. Использование GO для работы с массовыми данными

3.1 Получение выборки последовательностей белков с функцией : Биосинтез аминокислот.

Итак,необходимо найти все белки морской свинки, выполняющие функцию биосинтеза аминокислот (amino acid biosynthesis) .

По итогам запроса термина GO был выбран GO:0008652 - на мой взгляд наиболее подходящий,

так как содержал такое описание:cellular amino acid biosynthetic process . В отличие от остальных,которые содержали

синтез какой-либо определённой аминокислоты. Термин относится к словарю biological process .

На запрос:

к сожалению,не было найдено ни одной находки. Т.е. такой термин GO ещё не аннотирован.

При проверке остальных терминов результаты были те же:находок не обнаружено.

И хотя морская свинка распространённый модельный организм и его геном секвенирован уже примерно 5 лет назад,всё-таки

многие данные ещё не имеют соответственных терминов GO, а соответственно и функциональной аннотации.

3.2 Определение главной функции в большом списке белков

С помощью прораммы GOstat было определено,белки с какими функциями доминируют в списке P28629.txt.

Термин GO

Кол-во соответств.ему белков P-Value Ontology функция

GO:0005886 18 4.99e-15 cellular component цитоплазматическая мембрана

GO:0042597 7 8.41e-05 cellular component периплазматическое пространство

GO:0005624 3 8.98e-05 cellular component мембранная фракция

GO:0000267 3 8.98e-05 cellular component клеточная фракция

GO:0004351 2 0.000839 molecular function глутамат-декарбоксилазная активность

GO:0006536 3 0.00157 biological process метаболизм глутамата

GO:0008792 2 0.00213 molecular function аргинин-декарбоксилазная активность

GO:0009064 5 0.00366 biological process метаболизм аминокислоты глутамина GO:0005515 10 0.00483 molecular function белок-рецептор

GO:0008917 9 0.00501 molecular function липополисахарид N-ацетилглюкозминилтрансферазная активность

GO:0033692 4 0.00882 biological process биосинтез клеточных полисахаридов

GO:0008949 1 0.00882 molecular function ацетил-КоА декарбоксилазная активность GO:0006525 3 0.00926 biological process метаболизм аргинина

Данные находки получены на запрос с ограничением на P-Value<0.01 . Можно сказать,что разрыв P-Value между первым и

вторым термином составляет 10 порядков,что могло бы свидетельствовать о  пороговом значении вероятности того, что частота

термина GO близка к его частоте в случайной выборке терминов.

Как видно из данных,одной из основных функций в выборке белков является метаболизм глутамата,а также аргинина.

Мой белок ADIA_ECOLI относится к термину GO:0008792.

*Список терминов,ассоциированных с белком ADIA_ECOLI:

термин GO
онтология GO
Функция
GO:0003824
molecular function
enzyme activity
GO:0005737
cellular component
cytoplasm
GO:0006520
biological process
amino acid metabolic process
GO:0016829
molecular function
lyase activity
GO:0016831
molecular function
decarboxylase activity
GO:0030170
molecular function
pyridoxal phosphate binding
GO:0008792
molecular function
L-arginine carboxy-lyase (agmatine-forming) activity

Чего и следовало ожидать,все эти термины описывают функции,принадлежащие моему белку. Почти все эти термины более

подробно разобраны в предыдущих заданиях, связанных с изучением функции данного белка.

 

©Терешкова Алеся,2010e