GO, String, Human Protein Atlas

GO Enrichment Analysis

1. Анализировался файл list12.txt, в котором содержится 16 ID.
2. В обогащении, как видно на Рис.1, участвовали все 16 ID.

Рис.1 Выдача на сайте pantherdb

3. В выдаче оказалось 76 GO terms - это все terms c поправленным P-value меньше, чем 0.05.
4. Самыми значимыми GO terms являются:
macromolecule glycosylation
glycosylation
protein glycosylation
glycoprotein biosynthetic process
glycoprotein metabolic process
oligosaccharide biosynthetic process
oligosaccharide metabolic process
carbohydrate biosynthetic process
carbohydrate derivative biosynthetic process
carbohydrate derivative metabolic process
carbohydrate metabolic process
5. Граф для пяти наиболее значимых GO terms:

Рис.2 Граф.

6. Почти все узлы графа связаны типом отношений is a, однако GO:0006486 и GO:0009101 связаны типом отношений is a part of (protein glycolisation is a part of glycoprotein biosynthetic process). Видно, что 5 анализируемых GO terms расположены близко на графе.
7. Наиболее вероятно, что ID из даного списка связаны с синтезом гликопротеинов, в частности, с гликолизированием белков.

String

1. Картинка с графом:

Рис.3Ещё один граф

2. 3D-структуры известны для 15 из 16 белков.
3. Узлы графа связаны следующими типами взаимодействий:
from curated databases
experimentally determined
gene neighborhood
gene fusions
gene co-occurrence
textmining
co-expression
protein homology
4. Список белков достаточно неконсервативен - все гены консервативны для Opistiokonta, однако ортологи этих белков есть далеко не у всех Эукариот, почти не представлены у Архей (за исключением таксона Euryarchaeota, в котором есть ортологи 6 генов - примечательно, что все эти белки имеют названия FUT1,FUT2,FUT3, etc. Поискав про них информацию, было найдено, что это всё различные фукозилтрансферазы.). У Бактерий совсем нет ортологов B3GALT5, B3GNT3, ST3GAL3, ST8SIA5 и B3GNT5. Для всех остальных белков в данном таксоне ортологи присутствуют.

Рис.4 Gene cooccurence.

5. У человека наблюдается коэкспрессия генов B3GNT3 и FUT3. У мыши (Mus musculus) коэкспрессируются гены FUT4 и B3GNT3. Большое количество генов экспрессируется друг с другом у 1-2 изученных организмов (видно по бледным квадратикам на схеме).

Рис.5 Gene coexpression.

Human Protein Atlas

1. Выбранный ID - B3GNT5 (beta-1,3-N-acetylglucosaminyltransferase 5)
2. Вышеобозначенная трансфераза играет ключевую роль в навешивании остатков лактозы (?) на гликолипиды. Особенно выраженную активность проявляет в отношении лактозилцерамида.
3. Белок не специфичен для какого-либо участка мозга у человека и свиньи, а вот у мыши он больше экспрессируется в мозжечке (cerebellum)

Рис.6 Специфичность экспрессии в мозге.

4. По подтвержденным данным, в клетке белок локализован преимущественно в ядрышках.

Рис.7 Местоположение в клетке.

5. В большинстве органов белок присутствует в большем количестве, чем РНК (лёгкие, почки, репродуктивные органы), однако в пищеварительном тракте РНК намного больше, чем белка, в крови белка вообще нет, а в костном мозге РНК и белок присутствуют примерно в равном количестве.

Рис.8 Сравнение количества РНК и белка.

6.Если рассматривать ID как РНК, то он экспрессируется преимущественно в тонкой кишке, толстой кишке и костном мозге.

Рис.8 Экспрессия в тканях.