Практикум 11. GO - String - Human Protein Atlas.

Часть 1. GO Enrichment Analysis

Название вашего файла с ID и количество ID в списке: list6.txt; 21 ID

Сколько ID участвовало в результате в анализе обогащения? Если меньше, чем было в списке изначально – укажите причину: Участвовали все

Сколько GO terms оказалось в выдаче? Почему именно столько?: 58; это все находки с хорошими значениями FDR

Приведите список десяти самых значимых GO terms: small molecule catabolic process (GO:0044282); carboxylic acid catabolic process (GO:0046395); organic acid catabolic process (GO:0016054); oxidation-reduction process (GO:0055114); organic substance catabolic process (GO:1901575); cellular catabolic process (GO:0044248); carboxylic acid metabolic process (GO:0019752); oxoacid metabolic process (GO:0043436); catabolic process (GO:0009056); organic acid metabolic process (GO:0006082)

Приведите картинку графа, где отмечены 5 самых значимых GO terms: (рисунок 1)

1

Рисунок 1. Граф для 5 находок

Проинтерпретируйте полученные результаты. Какими отношениями соединены узлы полученного графа? Что объединяет ID вашего списка? Охарактеризуйте ваш список ID, воспользовавшись любым количеством GO terms: Все узлы полученного графа связаны отношениями принадлежности, связи метаболических процессов. Оба графа (рисунок 1 и рисунок 2) говорят о том, что выбранные идентификаторы определяют участников процессов, связанных с метаболизмом и катаболизмом молекул-кислот и оксикислот.

1

Рисунок 2. Граф для 10 находок

Часть 2. String

Получившийся граф, вставьте картинку:

1

Рисунок 3. Получившийся граф

Для скольких узлов указано наличие 3D-структур (смотрите подсказки в Legend)?: Для всех

Какими типами взаимодействий связаны узлы вашего графа?: Known Interactions (from curated databases; experimentally determined); Predicted Interactions (gene neighborhood; gene co-occurrence); Others (textmining; co-expression; protein homology)

Обсудите консервативность ID вашего списка. Приведите картинку (cooccrurrence): Основываясь на рисунке 4 можно сказать, что выбранные белки очень консервативны, особенно для Opisthoconta и ближайших групп. В целом по этому признаку особо выделяются 6 белков: ALDH2, ALDH9A2, ALDH9A1, ALDH4A1, ALDH1B1, ALDH7A1. Судя по всему, все выбранные белки - участники базовых процессов как в эукариотических, так и прокариотических клетках и в целом могли появиться уже у LUCA.

1

Рисунок 4. GENE COOCCURRENCE

Обсудите совместную экспрессию ID вашего списка, а также отличие паттернов коэкспрессии у человека и других видов. Приведите картинку (coexpression): Судя по всему, некоторые коэкспрессионные связи имеются, хотя и достаточно слабые. Я бы выделила следующие пары белков: GAD2 и ABAT; ALDH2 и AOC3 - поскольку они достаточно ярко выделяются как в Homo sapiens, так и в других организмах.

1

Рисунок 5. GENE COEXPRESSION