На страницу четвёртого семестра

Знакомство с терминологией GO

  1. Описание функции HutP_Bacsu с помощью аннотации Gene Ontology
  2. Описание функции белка xxx_Ecoli в соответствии с GO-аннотацией

      Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
    (краткое описание, близкое к тексту определения термина(ов) GO
    Где?   Ничего не нашлось.  
    Зачем, для чего? Biological process 3 1) Транскрипция - клеточный синтез РНК по матрице ДНК.
    2) Регуляция транскрипции - процесс, влияющий на частоту, скорость или распрастранение транскрипции.
    3) Метаболизм гистидина - химические реакции и метаболические пути с участием гистидина.
    Молекулярный механизм? Molecular function 1 Связывание с РНК - селективное и нековалентное взаимодействие с РНК.
    Специфичность?   Ничего не нашлось  

  3. Описание трёх терминов GO
  4. У моего белка все термины очень широкие. Я выбрала
    1. regulation of transcription, DNA-dependent
    2. histidine metabolic process
    3. RNA binding

    Описание терминов GO

    GO ID выбранного термина
    Список синонимов
    Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
    GO:0006355

    регулция транскрипции,
    контроль транскрипции
    Связь is a:
    1. GO:0010468 regulation of gene expression
    2. GO:0051252 regulation of RNA metabolic process
    3. GO:2000112 regulation of cellular macromolecule biosynthetic process
    4. GO:0019219 regulation of nucleobase, nucleoside, nucleotide and nucleic acid metabolic proces
    Связь regulates
    1. GO:0006351 transcription, DNA-dependent
    Для всех терминов связь is a
    1. GO:0045892 negative regulation of transcription, DNA-dependent
    2. GO:0045893 positive regulation of transcription, DNA-dependent
    3. GO:0045896 regulation of transcription during mitosis
    4. GO:0051037 regulation of transcription during meiosis
    5. GO:0009373 regulation of transcription by pheromones
    6. GO:0045990 carbon catabolite regulation of transcription
    7. GO:0006356 regulation of transcription from RNA polymerase I promoter
    8. GO:0006357 regulation of transcription from RNA polymerase II promoter
    9. GO:0006359 regulation of transcription from RNA polymerase III promoter
    10. GO:0007532 regulation of transcription, mating-type specific
    11. GO:0032583 regulation of gene-specific transcription
    12. GO:0060194 regulation of antisense RNA transcription
    13. GO:0070028 regulation of transcription by carbon monoxide
    14. GO:0051090 regulation of sequence-specific DNA binding transcription factor activity
    15. GO:0031554 regulation of transcription termination, DNA-dependent
    16. GO:0032784 regulation of transcription elongation, DNA-dependent
    17. GO:2000142 regulation of transcription initiation, DNA-dependent
    18. GO:0090293 nitrogen catabolite regulation of transcription
    19. GO:0043620 regulation of transcription in response to stress
    20. GO:0031935 regulation of chromatin silencing
    21. GO:0044324 regulation of transcription involved in anterior/posterior axis specification
    GO:0006547

    метаболизм гистидина
    Для всех терминов связь is a:
    1. GO:0009075 histidine family amino acid metabolic proces
    2. GO:0046483 heterocycle metabolic process
    Для всех терминов связь is a:
    1. GO:0000105 histidine biosynthetic process
    2. GO:0006548 histidine catabolic process
    GO:0003723 Cвязь is a:
    GO:0003723 RNA binding
    Для всех терминов связь is a:
    1. GO:0035197 siRNA binding
    2. GO:0035198 miRNA binding
    3. GO:0000339 RNA cap binding
    4. GO:0035613 RNA stem-loop binding
    5. GO:0017069 snRNA binding
    6. GO:0017091 AU-rich element binding
    7. GO:0030515 snoRNA binding
    8. GO:0000049 tRNA binding
    9. GO:0003725 double-stranded RNA binding
    10. GO:0003727 single-stranded RNA binding
    11. GO:0003729 mRNA binding
    12. GO:0002151 G-quadruplex RNA binding
    13. GO:0042835 BRE binding
    14. GO:0008312 7S RNA binding
    15. GO:0019843 rRNA binding
    16. GO:0034336 misfolded RNA binding
    17. GO:0070883 pre-miRNA binding
    18. GO:0070878 pri-miRNA binding
    19. GO:0033204 ribonuclease P RNA binding
    20. GO:0070034 telomeric RNA binding
    21. GO:0001069 regulatory region RNA binding
    22. GO:0008135 translation factor activity, nucleic acid binding
    23. GO:0071208 histone pre-mRNA DCP binding
    24. GO:0034583 21U-RNA binding
    25. GO:0034584 piRNA binding
    26. GO:0000498 base pairing with RNA










Оценка качества функциональной аннотации белков в UniProt

  1. Определение числа реальных и гипотетических белков из морской свинки Cavia porcellus

  2. Русское название: Морская свинка
    Латниское название: Cavia porcellus
    Английское название: Domestic guinea pig
    Taxonomy ID: 10141
    Ранг: species

    Соотношение между реальными и гипотетическими белками из Cavia porcellus (по данным UniProt)

      Количество в UniProt Количество в UniRef100
    Существование белка доказано экспериментально 95 279
    Известны только соответствующие транскрипты 570 760
    Гипотетический белок, предсказан по гомологии 102 104
    Иные предсказанные гипотетические белки 75 75
    Всего 842 938
    Только 11% белков из UniProt были достоверно установлены. Меня несколько удивляет общее количество найденных белков (842) - не верится что для морской свинки найдено так мало. Поиск по UniRef отдельно даёт почему-то меньше находок, чем сумма "связанных с UniProt".





Использование GO для работы с массовыми данными

  1. Описание протеома бактерии Caldicellulosiruptor bescii DSM 6725 (Anaerocellum thermophilum)

    • Число белков протеома: 2652 (В UniProt нашлось 2660)
    • Число белков с хотя бы одной записью GO: 1663 (62,5 %)
    • Диаграмма по типу словарей:

    • Самые частые термины GO:
      F: GO:0005524 (ATP binding)
      C: GO:0005737 (cytoplasm)
      F: GO:0003677 (DNA binding)
      C: GO:0016021 (integral to membrane)
      P: GO:0006355 (regulation of transcription, DNA-dependent)
      P: GO:0055114 (oxidation-reduction process)
    • Файл Excel со сводными таблицами

  2. Получение выборки последовательностей белков с заданной функцией


  3. Карбоксилирование - Carboxylation
    Термин GO - carboxy-lyase activity
    Go ID - GO:0016831
    Словарь - Molecular Function
    Запрос SRS - ([uniprot-NCBI_TaxId:10141*] > ([uniprot-DbName:GO*] & [uniprot-DBxref:GO:0016831*]))
    Нашёлся всего один белок: C0JKE0_CAVPO
    В формате fasta

© Медведева