Практикум 11. GO - String - Human Protein Atlas

Часть 1 - GO Enrichment Analysis

  1.  

    List11.txt - 12 ID

  2.  

    В анализе обогащения участвовало 11 ID (Multiple mapping information: 1 ID)

  3.  

    В выдаче оказалось 121 GO terms (FDR P < 0.05). Ссылка на GO terms

  4.  

    Ссылка на список десяти самых значимых GO terms

  5.  
    tree_of_terms
    Рисунок 1.
    Древо GO terms, связанных с 5 наиболее значимых terms из выдачи анализа обогащения
  6.  

    Все категории связаны друг с другом исключительно отношениями наследования (общие и более частные категории). Высшие категории включают записи нижних категорий.

  7.  

    Почти все GO terms довольно близко связаны с тетрагидробиоптерином (например, с его синтезом, как у term с наименьшим FDR). Все terms включают в себя процесс синтеза этого соединения.

    Tetrahydrobiopterin_structure
    Рисунок 2.
    Структура тетрагидробиоптерина

    Тетрагидробиоптерин действительно является диолом и одной из его составных частей является птерин.

Часть 2 - String

  1.  
    graph_string
    Рисунок 3.
    Граф String, основанный на выдаче анализа обогащения
  2.  

    Для всех 12 узлов (ID) есть 3D структура

  3.  
    connections_string
    Рисунок 4.
    Связи в графе

    Некоторые белки списка оказываются просто гомологичными (например, Alkaline phosphatases ALP*) и выявляются вместе (co-occurrence, встречаются в одних и тех же организмах). Многие белки коэкспрессируются. Многие гены соседствуют (gene neighborhood). Информация о некоторых взаимодействиях получена на основе тестового анализа (видимо, взаимной встречаемости в статьях?, textmining), другие же взаимодействия доказаны экспериментально или (и) наблюдаются в курируемых БД.

    Интересно, что ALPs связаны с остальным графом через GCH1 (GTP cyclohydrolase 1) и его кофактором? PTS.

  4.  
    coocurrence
    Рисунок 5.
    Представленность ID списка в различных организмах

    Наиболее высококонсервативными являются белки PCBD1 (Pterin-4-alpha-carbinolamine dehydratase) и GCH1. В целом, белки (как, видимо, и вся система) не очень консервативна (вариативна).

  5.  
    coexpression
    Рисунок 6.
    Коэкспрессия в разных организмах. Балл коэкспрессии базирован на паттернах РНК экспрессии и со-регуляции белков.

    У всех (использованных в данном анализе) организмов наблюдается очень слабая коэкспрессия генов. Это означает, что граф построен больше на других взаимосвязях (описанных в пункте 3).

    Предположительно, только 2 гена человека экспрессируются вместе:

    ALPPL2 - Alkaline phosphatase, placental like 2
    ALPP - Alkaline phosphatase, placental
    RNA coexpression score 0.279
Вернуться на страницу семестра