Четвертый семестр    Контакты                      Проекты Заметки
Занятие 5. Gene Ontology

  1. Опишите функцию "своего" белка с помощью аннотации Gene Ontology

  2. Описание функции белка YWPJ_BACSU в соответствии с GO-аннотацией
    Онтология GO (название словаря)Количество разных ассоциированных терминов GOФункция белка
    Где? CN/AN/A
    Зачем, для чего?P2Дефосфорилирование. Процесс удаления одного или более остатка фосфорной кислоты из молекулы
    Молекулярный механизмF4Фосфатазная активность
    СпецифичностьF4N/A

  3. Опиcание 3 терминов GO, ассоциированных с моим белком

  4. Мной были выбраны термин GO:0016791 из словаря F и GO:0016311 из словаря P:

    Описание терминов GO
    GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
    GO:0016311нет
    biological process (GO:0008150)is_a(inferred)
    cellular process (GO:0009987)is_a(inferred)
    metabolic process (GO:0008152)is_a(inferred)
    cellular metabolic process (GO:0044237)is_a(inferred)
    phosphorus metabolic process (GO:0006793)is_a(inferred)
    phosphate-containing compound metabolic process (GO:0006796)is_a
    base-excision repair, base-free sugar-phosphate removal (GO:0006286)is_a
    negative regulation of dephosphorylation (GO:0035305)negatively_regulates
    phosphoanandamide dephosphorylation (GO:0035644)is_a
    phospholipid dephosphorylation (GO:0046839)is_a
    phosphorylated carbohydrate dephosphorylation (GO:0046838)is_a
    positive regulation of dephosphorylation (GO:0035306)positively_regulates
    protein dephosphorylation (GO:0006470)is_a
    regulation of dephosphorylation (GO:0035303)regulates
    GO:0016791Альтернативный id: GO:0016302 синонимы: phosphatase, phosphoric monoester hydrolase activity
    molecular_function (GO:0003674)is_a(inferred)
    catalytic activity (GO:0003824)is_a(inferred)
    hydrolase activity (GO:0016787)is_a(inferred)
    hydrolase activity, acting on ester bonds (GO:0016788)is_a(inferred)
    phosphoric ester hydrolase activity (GO:0042578)is_a
    10-hydroxy-9-(phosphonooxy)octadecanoate phosphatase activity (GO:0033885)is_a
    2-carboxy-D-arabinitol-1-phosphatase activity (GO:0047538)is_a
    2-hydroxy-3-keto-5-methylthiopentenyl-1-phosphate phosphatase activity (GO:0043716)is_a
    2-phosphosulfolactate phosphatase activity (GO:0050532)is_a
    3-deoxy-manno-octulosonate-8-phosphatase activity (GO:0019143)is_a
    3-phosphoglycerate phosphatase activity (GO:0047572)is_a
    3-phytase activity (GO:0016158)is_a
    5-amino-6-(5-phosphoribitylamino)uracil phosphatase activity (GO:0043726)is_a
    5-phytase activity (GO:0050533)is_a
    [3-methyl-2-oxobutanoate dehydrogenase (lipoamide)]-phosphatase activity (GO:0047385)is_a
    [acetyl-CoA carboxylase]-phosphatase activity (GO:0050406)is_a
    [glycogen-synthase-D] phosphatase activity (GO:0050407)is_a
    [hydroxymethylglutaryl-CoA reductase (NADPH)]-phosphatase activity (GO:0047384) is_a
    [phosphorylase] phosphatase activity (GO:0050196) is_a
    [pyruvate dehydrogenase (lipoamide)] phosphatase activity (GO:0004741) is_a
    [pyruvate kinase]-phosphatase activity (GO:0050408) is_a
    acid phosphatase activity (GO:0003993) is_a
    acireductone synthase activity (GO:0043874) is_a
    ADP-phosphoglycerate phosphatase activity (GO:0047630) is_a
    alkaline phosphatase activity (GO:0004035) is_a
    alkylacetylglycerophosphatase activity (GO:0047647) is_a
    alpha-ribazole phosphatase activity (GO:0043755) is_a
    aryldialkylphosphatase activity (GO:0004063) is_a
    bisphosphoglycerate phosphatase activity (GO:0034416) is_a
    caldesmon-phosphatase activity (GO:0047765) is_a
    carbohydrate phosphatase activity (GO:0019203) is_a
    D,D-heptose 1,7-bisphosphate phosphatase activity (GO:0034200) is_a
    deoxynucleotide 3'-phosphatase activity (GO:0047846) is_a
    dihydrosphingosine-1-phosphate phosphatase activity (GO:0070780) is_a
    dolichyl-phosphatase activity (GO:0047873) is_a
    glucosylglycerol 3-phosphatase activity (GO:0050530) is_a
    glycerol-1-phosphatase activity (GO:0000121) is_a
    glycerol-2-phosphatase activity (GO:0047954) is_a
    glycerol-3-phosphatase activity (GO:0043136) is_a
    guanidinodeoxy-scyllo-inositol-4-phosphatase activity (GO:0047383) is_a
    histidinol-phosphatase activity (GO:0004401) is_a
    inositol phosphate phosphatase activity (GO:0052745) is_a
    lipid phosphatase activity (GO:0042577) is_a
    lysophosphatidic acid phosphatase activity (GO:0052642) is_a
    mannitol-1-phosphatase activity (GO:0050084) is_a
    mannosyl-3-phosphoglycerate phosphatase activity (GO:0050531) is_a
    methylphosphothioglycerate phosphatase activity (GO:0047382) is_a
    myosin-light-chain-phosphatase activity (GO:0050115) is_a
    N-acylneuraminate-9-phosphatase activity (GO:0050124) is_a
    NADP phosphatase activity (GO:0019178) is_a
    nucleotidase activity (GO:0008252) is_a
    nucleotide phosphatase activity (GO:0019204) is_a
    phosphatidate phosphatase activity (GO:0008195) is_a
    phosphatidylglycerophosphatase activity (GO:0008962) is_a
    phosphatidylinositol phosphate phosphatase activity (GO:0052866) is_a
    phosphocholine phosphatase activity (GO:0052731) is_a
    phosphoenolpyruvate phosphatase activity (GO:0050189) is_a
    phosphoethanolamine phosphatase activity (GO:0052732) is_a
    phosphoglycerate phosphatase activity (GO:0050192) is_a
    phosphoglycolate phosphatase activity (GO:0008967) is_a
    phosphohistidine phosphatase activity (GO:0008969) is_a
    phosphoprotein phosphatase activity (GO:0004721) is_a
    phosphoserine phosphatase activity (GO:0004647) is_a
    pyridoxal phosphatase activity (GO:0033883) is_a
    sedoheptulose-bisphosphatase activity (GO:0050278) is_a
    sorbitol-6-phosphatase activity (GO:0050286) is_a
    sphingosine-1-phosphate phosphatase activity (GO:0042392) is_a
    streptomycin-6-phosphatase activity (GO:0050301) is_a
    thymidylate 5'-phosphatase activity (GO:0050340) is_a

    Три изображения графов родительских терминов:

    GO:0006793



    GO:0042578



    GO:0006796



  5. Опиcание протеома Cyanobacterium UCYN-A, с использованием терминов GO.

  6. Выбранная бактерия Cyanobacterium UCYN-A. Genome statistics и поиск по Uniprot дают 1199 белков. Всего 73,4 % записей приписан хотя бы 1 термин GO. Чаще всего встречаются термины из словаря F (1514 терминов), затем P (1004) и C (492).


    xls файл со всем необходимым
    Чаще встречаются термины из словаря F (молекулярная функция). Это связано с тем что функции белков очень разнообразны и одному белку можно приписать большое их количество. Очевидно наименьшее количество терминов C (локализация в клетке).
    СловарьGO IDСколько раз встретился
    F GO:0005524
    GO:0003735
    GO:0046872
    162
    53
    51
    P GO:0006412
    GO:0006508
    GO:0006200
    55
    47
    27
    C GO:0005737
    GO:0016021
    GO:0005840
    147
    100
    40

    Наиболее часто встречающийся термин GO:0005524 (словарь F), имеющий следующее описание: "Взаимодействующий селективно и нековалентно с АТФ, аденозин-5'-трифосфатом, всеобще важным коферментом и регулятором ферментов". Подавляющее большинство процессов требует энергии АТФ, так что всё закономерно.

  7. Получение выборки последовательностей белков с заданной функцией

  8. Данная биологическая функция соответствует термину GO:0008652(cellular amino acid biosynthetic process, тип словаря P). Организм - пшеница (род Triticum). Однолетние травянистые растения 40—150 см высотой. Стебли прямостоячие, полые или c cердцевиной. Влагалища почти до основания расщеплённые, на верхушке обычно с ланцетными ушками. Листья 3—15 (20) мм шириной, обычно плоские, линейные или широколинейные, голые или волосистые, шероховатые. Корневая система мочковатая. Тычинок 3, с пыльниками 2—4,5 мм длиной. Зерновки 5—10 мм длиной, свободные, толстые, наверху слегка волосистые, овальные или продолговатые, глубоко желобчатые. Крахмальные зёрна простые. Хромосомы крупные; основное число хромосом равно 7. Род делится на 5 секций, включающих 19 видов, а также содержит 10 гибридов (7 внутриродовых и 3 межродовых). NCBI TaxID: 4564. Мнемоника WHEAT. Запросы ([uniprot-Taxonomy:Triticum*] > ([uniprot-DbName:GO*] & [uniprot-DBxref:GO:0008652*])) и ([uniprot-ID:*_WHEAT*] > ([uniprot-DbName:GO*] & [uniprot-DBxref:GO:0008652*])) не дают никаких результатов. Это значит, что белки, участвующие в процессе еще не аннотированы в Uniprot. Когда я решил проверить и сделать запрос с родительским процессом GO:0006520 (cellular amino acid metabolic process), то получил результаты. Запрос аналогичный ([uniprot-ID:*_WHEAT*] > ([uniprot-DbName:GO*] & [uniprot-DBxref:GO:0006520*]).
    Результат поиска - 20 белковых последовательностей в fasta формате