Практикум №11

GO, String, Human Protein Atlas

GO Enrichment Analysis

1. Файл list5.txt - 10 ID

2. В процессе обогащения участвовали все 10.

3. В выдаче 14 GO terms. Все представлены в таблице ниже, отсортированной по FDR.

Homo sapiens (REF) # expected Fold Enrichment +/- raw P value FDR
amino-acid betaine metabolic process (GO:0006577) 18 2 0.01 + > 100 4.01e-05 0.0452
generation of precursor metabolites and energy (GO:0006091) 402 4 0.2 + 20.49 2.84e-05 0.0373
primary alcohol catabolic process (GO:0034310) 15 2 0.01 + > 100 2.87e-05 0.0348
ethanol oxidation (GO:0006069) 12 2 0.01 + > 100 1.92e-05 0.0303
ethanol catabolic process (GO:0006068) 12 2 0.01 + > 100 1.92e-05 0.0276
alcohol metabolic process (GO:0006066) 332 4 0.16 + 24.81 1.35e-05 0.0237
organic hydroxy compound catabolic process (GO:1901616) 79 3 0.04 + 78.21 7.14e-06 0.0188
primary alcohol metabolic process (GO:0034308) 85 3 0.04 + 72.69 8.84e-06 0.0174
amino-acid betaine biosynthetic process (GO:0006578) 7 2 0.0 + > 100 7.62e-06 0.0172
organic hydroxy compound metabolic process (GO:1901615) 484 5 0.24 + 21.28 1.68e-06 0.0133
small molecule catabolic process (GO:0044282) 409 5 0.2 + 25.18 7.41e-07 0.0117
alcohol catabolic process (GO:0046164) 56 3 0.03 + > 100 2.64e-06 0.0104
small molecule metabolic process (GO:0044281) 1623 7 0.79 + 1988-08-01 00:00:00 1.86e-06 0.00976
cellular aldehyde metabolic process (GO:0006081) 57 3 0.03 + > 100 2.78e-06 0.00876

Таблица 1. Пункт 4. GO terms.


Рис. 1. Пункт 5. Граф, построенный по 5 самым значимым GO terms, на котором отмечены дополнительно GO terms из выдачи.

6. Полученный граф имеет одну общую ветвь, которая отвечает за переработку этанола. Все ветви связаны между собой напрямую.

7. Как уже отмечалось выше, большинство GO terms связаны с метаболическими путями этанола. Для некоторых, кто не включён в граф это можно назвать даже просто из названия.

String

Рис. 2. Пункт 1. Графы String.

2. 3d структуры имеются для всех 10 белков.

3. Имеются следующие типы взаимодействий:

    🐾 textmining

    🐾 co-expression

    🐾 from curated databases

    🐾 gene co-occurrence

    🐾 protein homology

    🐾 gene fusions и experimentally determined (если отрисовать чуть-чуть побольше)

Рис. 3. Пункт 4. Консервативность списка белков.

4. Как видно, все является консервативным для Opisthokonta, когда для других клад так точно утверждать нельзя (для Бактерий и Архей слишком маленький процент схожести, да ешё и некоторые белки выпадают). Если разворачивать дерево далее, то станет понятно, что наиболее консервативен этот белок у Хордовых, а именно у Млекопитающих (ссылка).

Рис. 4. Пункт 5. Коэкспрессия.

Для человека данных о коэспрессии почти нет (есть одно слабое предсказание между ALDH2 и ADH1B). Наиболее склонны коэспрессироваться у Мыши и других организмов белки: ALDH9A1 и ADH5, CEL и PNLIPRP1.

Human protein atlas

1. Я выбрал ALDH2.

2. Этот белок относится к семейству белков альдегиддегидрогеназы. Альдегиддегидрогеназа является вторым ферментом основного окислительного пути метаболизма алкоголя. Существует две основные печеночные изоформы альдегиддегидрогеназы, цитозольная и митохондриальная, которые можно отличить по их электрофоретической подвижности, кинетическим свойствам и субклеточной локализации. Повышенное воздействие ацетальдегида у лиц с каталитически неактивной формой также может привести к большей восприимчивости ко многим видам рака.

3. Нет специфичного участка экспрессии в мозге.

4. Нет специфичного участка экспрессии в клетке, что странно, так как белок митохондриальный...

5. В лёгких, эндокринных железах, пищевом тракте, почках, коже, мужских половых органах и костях больше экспрессируется белка. В мозге - почти одинаковые уровни экспрессии белка и РНК. В остальных тканях и органах больше экспрессируется РНК.

6. Если рассматривать ID, как РНК, то он больше всего экспрессируется в печени (логично, алкогольдегидрогеназы там нужны).