GO - String - Human Protein Atlas

Часть 1

  • Название вашего файла с ID и количество ID в списке: list24.txt с 22 ID
  • Сколько ID участвовало в результате в анализе обогащения? Если меньше, чем было в списке изначально – укажите причину: участвовало 22 ID
  • Сколько GO terms оказалось в выдаче? Почему именно столько? В выдаче оказалось 123 GO terms - все, что прошли соотвествующий порог p-value (FDR<0.05)
  • Cписок десяти самых значимых GO terms: pteridine-containing compound metabolic process (GO:0042558), folic acid-containing compound metabolic process (GO:0006760), coenzyme metabolic process (GO:0006732), one-carbon metabolic process (GO:0006730), tetrahydrofolate metabolic process (GO:0046653), folic acid metabolic process (GO:0046655), cofactor metabolic process (GO:0051186), dicarboxylic acid metabolic process (GO:0043648), carboxylic acid metabolic process (GO:0019752), oxoacid metabolic process (GO:0043436)
  • Граф с 5 самых значимых GO terms, полученный с помощью QuickGO,представлен на Рис. 1 .
  • Все узлы свзяаны соотношением "is a", кроме coenzyme metabolic process (GO:0006732), который оказался не связанным ни с одной вершиной графа.Почти все исследуемые ID участвуют в клеточном метаболизме.
  • Something went wrong :(
     Рис. 1 Граф с 5 самых значимых GO terms
    Something went wrong :(
     Рис. 2 Граф взаимодействий белков

    Часть 2

  • Для скольких узлов указано наличие 3D-структур (смотрите подсказки в Legend)? Для всех. На графе это можно увидеть по тому, что все шарики заполненны струтурами
  • Какими типами взаимодействий связаны узлы вашего графа? Типы большинства взаимодействий известны из курированых баз данных(голубые), хотя некоторые определены экспериментально(розовые). Подавляющее большинство связей определено с помощью анализа текстовой информации - textmining (салатовый), некоторые связи - из-за соседства белков (зелёный). Многие белки коэкспрессируются (чёрный), а некоторые известны из-за совместной встречаемости генов (синий). PRPF31 оказался не включенным в общий граф.
  • Представленность изучаемого набора белков в различных организмах представлена на Рис. 3. Видно, что некоторые белки (например, DLD,GLDC) довольно консервативны, особенно для Opisthoconta и ближайших групп.
  • На Рис. 4 представленны данные о коэкспрессии генов данных белков. Видно, что среди всех организмов ген AMT часто коэкспрессируется с 4 другими генами, а GCSH - c GLDC. У человека коэкспрессия проявляется хуже, но тенденция к ней есть, например, у DHFR и GCSH.
  • Something went wrong :(
     Рис. 3  Представленность генов. Интенсивность цвета отражает score выравнивания.  
    Something went wrong :(
     Рис. 4  Gene coexpression