Четвертый семестр

Знакомство с терминологией GO

  1. Описание функции белка с помощью аннотации Gene Ontology

    Описание функции белка THIM_BACSU в соответствии с GO-аннотацией

      Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
    Где?   Ничего не нашлось  
    Зачем, для чего? Biological process 3 1)процесс биосинтеза тиамина - химические реакции и пути результатом которыхявляется синтез тиамина (витамина В1)(водорастворимый витамин представленый свежих овощах, мясе и особенно в печени)
    2)фосфорилирование - процесс введения фосфата в молекулу, резултатом чего является формирование фосфоэфирной связи, фосфорного ангидрида или афосфоамида
    Молекулярный механизм? Molecular function 7 1)связывание нуклеотидов - селективное и нековалентное взаимодействие с нуклеотидами или с любым веществом, состоящим из нуклеозидов, соеденных с ортофосфатом или олигофосфатом посредством гидроксильной группы рибозы или дезоксирибозы
    2)гидрокситиазольная активность - катализ реакции: 5-(2-гидроксиэтил)-4-метилтиазол + ATФ = 4-метил-5-(2-фосфоэтил)-тиазол + AДФ + 2 H(+)
    3)связывание АТФ - специфическое и нековалентное взаимодействие с АТФ (аденозин 5'-трифосфатом), являющимся универсальным и важным кофактором и регулятором ферментов.
    4)киназная активность - катализ реакции по переносу фосфатной группы, как правило с АТФ, на молекулу субстрата
    5)трансферазная активность - катализ реакции переноса группы, например метильной, ацильной, фосфатной и других групп с одного соединения (донора) на другое (акцептор)
    6)связывание ионов металлов - специфическое и нековалентное взаимодействие с ионами металлов.
    Специфичность?   ничего не нашлось  
  2. Описание трёх терминов GO
  3. Термины G, выбранные для описания:
    • Биосинтез тиамина
    • Гидрокситиазолкиназная активность
    • Киназная активность
    Описание терминов GO
    GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
    GO:0009228 процесс биосинтеза витамина B1
    биосинтез витамина В1
    биосинтез тиамина
    анаболизм тиамина
    синтез тиамина
    формирование тиамина
    процесс биосинтеза тиамина
    Связь is a:
    1. GO:0042724 - биосинтез соединений, содержащих тиамин
    2. GO:0006772 - процессы метаболизма тиамина
    1. GO:0090180 - положительная регуляция биосинтеза тиамина
    2. GO:0070623 - регуляция процессов биосинтеза тиамина
    3. GO:0070624 - отрицательная регуляция процессов биосинтеза тиамина
    GO:0004417 AТФ:4-метил-5-(2-гидроксиэтил)тиазол 2-фосфотрансферазная активность
    гидрокситиазол киназа(фосфорилирование)
    4-метил-5-(β-гидроксиэтил)тиазол киназная активность
    Связь is a:
    1. GO:0016301 - киназная активность
    2. GO:0016773 - фосфотрансферазная активность, гидроксильная группа - акцептор
    нет
    GO:0016772 трансферазная активность, перенос фосфор-содержащей групп Связь part of:
    1. GO:0016310 - фосфорилирование
    Связь is a
    GO:0017050 D-erythro-sphingosine kinase activity
    GO:0050515 4-(cytidine 5'-diphospho)-2-C-methyl-D-erythritol kinase activity
    GO:0003951 NAD+ kinase activity
    GO:0003991 acetylglutamate kinase activity
    GO:0004020 adenylylsulfate kinase activity
    GO:0004103 choline kinase activity
    GO:0004111 creatine kinase activity
    GO:0004140 dephospho-CoA kinase activity
    GO:0004143 diacylglycerol kinase activity
    GO:0004168 dolichol kinase activity
    GO:0043868 N-acetylaminoadipate kinase activity
    GO:0042736 NADH kinase activity
    GO:0004305 ethanolamine kinase activity
    GO:0004370 glycerol kinase activity
    GO:0004371 glycerone kinase activity
    GO:0004417 hydroxyethylthiazole kinase activity
    GO:0004428 inositol or phosphatidylinositol kinase activity
    GO:0004496 mevalonate kinase activity
    GO:0009927 histidine phosphotransfer kinase activity
    GO:0019200 carbohydrate kinase activity
    GO:0019202 amino acid kinase activity
    GO:0019205 nucleobase, nucleoside, nucleotide kinase activity
    GO:0043744 N2-acetyl-L-aminoadipate kinase activity
    GO:0043749 phenol, water dikinase activity
    GO:0043752 adenosylcobinamide kinase activity
    GO:0043798 glycerate 2-kinase activity
    GO:0043841 (S)-lactate 2-kinase activity
    GO:0008776 acetate kinase activity
    GO:0008804 carbamate kinase activity
    GO:0008819 cobinamide kinase activity
    GO:0008887 glycerate kinase activity
    GO:0008902 hydroxymethylpyrimidine kinase activity
    GO:0008906 inosine kinase activity
    GO:0008972 phosphomethylpyrimidine kinase activity
    GO:0008974 phosphoribulokinase activity
    GO:0008976 polyphosphate kinase activity
    GO:0008980 propionate kinase activity
    GO:0008986 pyruvate, water dikinase activity
    GO:0004594 pantothenate kinase activity
    GO:0004618 phosphoglycerate kinase activity
    GO:0004631 phosphomevalonate kinase activity
    GO:0004672 protein kinase activity
    GO:0004743 pyruvate kinase activity
    GO:0004756 selenide, water dikinase activity
    GO:0004765 shikimate kinase activity
    GO:0030387 fructosamine-3-kinase activity
    GO:0008478 pyridoxal kinase activity
    GO:0008531 riboflavin kinase activity
    GO:0043843 ADP-specific glucokinase activity
    GO:0043844 ADP-specific phosphofructokinase activity
    GO:0050521 alpha-glucan, water dikinase activity
    GO:0009024 tagatose-6-phosphate kinase activity
    GO:0009029 tetraacyldisaccharide 4'-kinase activity
    GO:0009030 thiamine-phosphate kinase activity
    GO:0009038 undecaprenol kinase activity
    GO:0018720 phenol kinase activity
    GO:0019165 thiamine kinase activity
    GO:0046316 gluconokinase activity
    GO:0046522 S-methyl-5-thioribose kinase activity
    GO:0047321 diphosphate-protein phosphotransferase activity
    GO:0047324 phosphoenolpyruvate-glycerone phosphotransferase activity
    GO:0047327 glycerol-3-phosphate-glucose phosphotransferase activity
    GO:0001727 lipid kinase activity
    GO:0047328 acyl-phosphate-hexose phosphotransferase activity
    GO:0047329 phosphoramidate-hexose phosphotransferase activity
    GO:0047330 polyphosphate-glucose phosphotransferase activity
    GO:0047331 diphosphate-glycerol phosphotransferase activity
    GO:0047332 diphosphate-serine phosphotransferase activity
    GO:0047336 5-methyldeoxycytidine-5'-phosphate kinase activity
    GO:0047506 (deoxy)adenylate kinase activity
    GO:0047590 5-dehydro-2-deoxygluconokinase activity
    GO:0047601 acetate kinase (diphosphate) activity
    GO:0047620 acylglycerol kinase activity
    GO:0047628 ADP-thymidine kinase activity
    GO:0047633 agmatine kinase activity
    GO:0047649 alkylglycerol kinase activity
    GO:0047650 alkylglycerone kinase activity
    GO:0047666 ammonia kinase activity
    GO:0047667 AMP-thymidine kinase activity
    GO:0047700 beta-glucoside kinase activity
    GO:0047715 hypotaurocyamine kinase activity
    GO:0047758 ATP:2-methylpropanoate phosphotransferase activity
    GO:0047761 butyrate kinase activity
    GO:0047814 D-arabinokinase activity
    GO:0047841 dehydrogluconokinase activity
    GO:0047878 erythritol kinase activity
    GO:0047887 farnesyl diphosphate kinase activity
    GO:0047900 formate kinase activity
    GO:0047912 galacturonokinase activity
    GO:0047931 glucosamine kinase activity GO:0047933 glucose-1,6-bisphosphate synthase activity
    GO:0047937 glucose-1-phosphate phosphodismutase activity
    GO:0047940 glucuronokinase activity
    GO:0047944 glutamate 1-kinase activity
    GO:0047973 guanidinoacetate kinase activity
    GO:0047976 hamamelose kinase activity
    GO:0047992 hydroxylysine kinase activity
    GO:0050059 lombricine kinase activity
    GO:0050073 macrolide 2'-kinase activity
    GO:0050154 opheline kinase activity
    GO:0050165 pantetheine kinase activity
    GO:0050190 phosphoglucokinase activity
    GO:0050191 phosphoglycerate kinase (GTP) activity
    GO:0050195 phosphoribokinase activity
    GO:0050201 fucokinase activity
    GO:0050225 pseudouridine kinase activity
    GO:0050257 riboflavin phosphotransferase activity
    GO:0050262 ribosylnicotinamide kinase activity
    GO:0050276 scyllo-inosamine 4-kinase activity
    GO:0050277 sedoheptulokinase activity
    GO:0050316 T2-induced deoxynucleotide kinase activity
    GO:0050317 tagatose kinase activity
    GO:0050324 taurocyamine kinase activity
    GO:0050331 thiamine-diphosphate kinase activity
    GO:0050354 triokinase activity
    GO:0050394 viomycin kinase activity
    GO:0050400 xylitol kinase activity
    GO:0034071 aminoglycoside phosphotransferase activity
    GO:0010276 phytol kinase activity
    GO:0071518 autoinducer-2 kinase activity
    GO:0051752 phosphoglucan, water dikinase activity
    Связь regulates
    GO:0043549 regulation of kinase activity
    GO:0019207 kinase regulator activity
    Связь Positively regulates
    GO:0019209 kinase activator activity
    GO:0033674 positive regulation of kinase activity
    Связь Negatively regulates: GO:0019210 kinase inhibitor activity
    GO:0033673 negative regulation of kinase activity

    GO:0009228

    GO:0004417

    GO:0016772

    Оценка качества функциональной аннотации белков в UniProt

  4. Определение реального и гипотетического числа белков из таксона Bos taurus
  5. писание таксона:
    Русское название - Корова
    Английское название - Cow
    Латинское название- Bos taurus
    Taxonomy ID: 9913
    Ранг - species (вид)

    Поле ProteinExistence БД UniProt в SRS проиндексировано следующим образом:
    1 - evidence at protein level (cуществование белка доказано экспериментально)
    2 - evidence at transcript level (существование белка доказано на уровне соответствующих ему транскриптов)
    3 - inferred from homology (предсказан по гомологии)
    4 - predicted (предсказан другими способами)
    5 - uncertain (существование белка не доказано)

    Соотношение между реальными и гипотетическими белками из Bos taurus (по данным UniProt)

      Количество в UniProt Количество в UniRef100
    Существование белка доказано экспериментально 1353 1363
    Известны только соответствующие транскрипты 11853 11670
    Гипотетический белок, предсказан по гомологии 885 949
    Иные предсказанные гипотетические белки 1605 1418

    В UniProt и UniRef100 представлено практически одинаковое число белков каждой группы в ProteinExistence, при этом наибольшее число белков предсказаны по транскриптам.
  6. Определение качества функциональной аннотации
  7. Коды экспериментального доказательства функции:
    EXP: Inferred from Experiment
    IDA: Inferred from Direct Assay
    IPI: Inferred from Physical Interaction
    IMP: Inferred from Mutant Phenotype
    IGI: Inferred from Genetic Interaction
    IEP: Inferred from Expression Pattern
    Был составлен запрос:
    (((([uniprot-Species:Bos*] & [uniprot-Species:taurus*]) | [uniprot-Species:Bos taurus*]) & ((((([uniprot-ProteinExistence:1:*] & [uniprot-ProteinExistence:Evidence*]) & [uniprot-ProteinExistence:at*]) & [uniprot-ProteinExistence:protein*]) & [uniprot-ProteinExistence:level*]) | [uniprot-ProteinExistence:1: Evidence at protein level*])) & ((((([uniprot-DBxref_:EXP*] | [uniprot-DBxref_:IDA*]) | [uniprot-DBxref_:IPI*]) | [uniprot-DBxref_:IMP*]) | [uniprot-DBxref_:IGI*]) | [uniprot-DBxref_:IEP*]))
    Последовательности найденных белков можно посмотреть в 1.fasta.

    Использование GO для работы с моссовыми данными

  8. Описание протеома бактерии Caldicellulosiruptor bescii DSM 6725
    • Число белков протеома: 2652 (В UniProt нашлось 2660)
    • Число белков с хотя бы одной записью GO: 1663 (62,5 %)
    • Диаграмма по типу словарей:

    • Самые частые термины GO:
      F: GO:0005524 (ATP binding)
      C: GO:0005737 (cytoplasm)
      F: GO:0003677 (DNA binding)
      C: GO:0016021 (integral to membrane)
      P: GO:0006355 (regulation of transcription, DNA-dependent)
      P: GO:0055114 (oxidation-reduction process)
    • Файл Excel со сводными таблицами
  9. Получение выборки последовательностей белков с заданной функцией
  10. На сайте консорциума Gene Ontology был проведён поиск функции биосинтеза пиримидинов среди всех терминов GO (всего 17 находок). Выбран идентификатор GO GO:0006221 (pyrimidine nucleotide biosynthetic process), относящийся к словарю biological process.
    В SRS-поиске был составлен запрос: ([uniprot-DBxref_:GO:0006221*] & (([uniprot-Species:Bos*] & [uniprot-Species:taurus*]) | [uniprot-Species:Bos taurus*]))
    Найдено 2 белка из таксона Bos taurus с данной функцией. Результаты поиска можно увидеть в файле uni.txt.

    Определение главной функции в большом списке белков


    С помощью GOstat определяем, белки с какой функцией доминируют в списке P0A9G6. P-value лучших находок не меньше 13 порядка:

    GO ID Название (функция) Онтология P-value
    GO:0006097 glyoxylate cycle biological process 3.96e-13
    GO:0046487 glyoxylate metabolic process biological process 6.25e-13
    GO:0006081 cellular aldehyde metabolic process biological process 3.89e-11
    GO:0044248 cellular catabolic process biological process 1.83e-06
    GO:0006099 tricarboxylic acid cycle biological process 2.04e-06
    GO:0046356 acetyl-CoA catabolic process biological process 2.04e-06
    GO:0009109 coenzyme catabolic process biological process 2.04e-06
    GO:0051187 cofactor catabolic process biological process 2.05e-06
    GO:0006084 acetyl-CoA metabolic process biological process 2.13e-06
    GO:0009056 catabolic process biological process 2.13e-06
    GO:0044262 cellular carbohydrate metabolic process biological process 1.44e-05
    GO:0032787 monocarboxylic acid metabolic process biological process 3.2e-05
    GO:0019752 carboxylic acid metabolic process biological process 4.33e-05
    GO:0006082 organic acid metabolic process biological process 4.37e-05

    Как видно из таблицы, белки функционируют в цитоплазме и участвуют в метаболизме и катаболизме карбоновых кислот, в частонсти, доминантные белки отвечают за катаболизм ацетил-CoA.


©Анисенко Андрей