Учебный сайт
Владимира Ноздрина

GO Enrichment Analysis

1. Файл с ID назывался list32.txt. В нём 13 идентификаторов.
2. В анализе использовалось только 12 из них, потому что HEXDC не картирован. NAGA и NEU1 картированы по два раза.
Выдачу можно посмотреть по ссылке.
3. В выдаче 85 GO Terms. У всех остальных FDR P-Value больше, чем 0.05.
4. Список самых значимых из них:
1) carbohydrate derivative catabolic process (GO:1901136)
2) carbohydrate derivative metabolic process (GO:1901135)
3) liposaccharide metabolic process (GO:1903509)
4) glycolipid metabolic process (GO:0006664)
5) keratan sulfate catabolic process (GO:0042340)
6) glycolipid catabolic process (GO:0019377)
7) granulocyte activation (GO:0036230)
8) neutrophil activation (GO:0042119)
9) leukocyte degranulation (GO:0043299)
10) aminoglycan catabolic process (GO:0006026)
5. Граф с пятью самыми значимыми представлен на картинке ниже: 6. Все узлы графа соединены отношением is a. Все пять из них находятся на графе довольно близко. Все относятся к метаболизму производных углеводородов, а конкретно гликолипидов и кератана.
7. Кажется, что ID из моего списка объединяет то, что они как-то связаны с мембраной клетки. (Там есть GO Terms связанные с экзоцитозом, иммунным ответом и прочим)

String

1. Полученный граф представлен на картинке ниже: 2. Наличие 3D указано для всех белков из списка. 3. Узлы связаны всеми возможными взаимодействиями: from curated databases, experimentally determined, gene neighborhood, gene fusions, gene co-occurrence, textmining, co-expression, protein homology.
4. Гомологи этих белков встречаются как у эукариот, так и у бактерий и архей. У архей отсутствуют NEU1, ENGASE, CTSA, но поскольку они есть у бактерий, можно предположить, что похожие белки были у LUCA.
5. Не все паттерны коэкспрессии, которые есть у других видов, есть у человека. Например, у человека совсем ни с кем не экспрессируются GALNS, HEXDC, NEU1, ENGASE; а у других видов только HEXDC и ENGASE. Я думаю, у человека нет некоторых из взаимодействий, которые есть у других видов, потому что их ещё не успели экспериментально описать, хотя на самом деле они есть.

Human Protein Atlas

1. Я выбрал CTSA.
2. Ген кодирует карбоксипептидазу. Есть альтернативный сплайсинг, из-за которого может образоваться много вариантов, но как минимум один из вариантов — это карбоксипептидаза, которая нужна для правильной работы бета-галактозидазы и нейраминидазы.
3. Ген не специфичен для какого-либо участка мозга, потому что он экспрессируется во всех участках мозга. 4. Продукт гена в норме находится только в везикулах. 5. Почти везде белка экспрессируется больше, чем РНК. Исключения: в эндокринных железах и жировых тканях РНК немного больше, чем белка, а в глазах и крови есть только РНК. 6. CTSA экспрессируется во всех тканях. Особенно сильно в надпочечниках, почках и гранулоцитах.