Gene Ontology.

Цель работы - выполнить работу

1. GO Enrichment Analysis

Файл: list32.txt
В списке 14 ID. Вот они сверху вниз:
ID:
AGA
CTSA
ENGASE
FUCA1
FUCA2
GALNS
GLB1
GNS
HEXA
HEXB
HEXDC
NAGA
NEU1


12 из 13 ID участвовало в результате в анализе обогащения. Их меньше, чем было в списке изначально, потому что, возможно, есть несоответствия ID между различными базами данных. Сервис указал количество прошедших в итоге ID и выдал отчет по непрошедшим.

В выдаче оказалось 83 GO terms (остальные имели p-value > 0.05)

Список десяти самых значимых GO terms:

carbohydrate derivative catabolic process GO:1901136
carbohydrate derivative metabolic process GO:1901135
liposaccharide metabolic process GO:1903509
glycolipid metabolic process GO:0006664
keratan sulfate catabolic process GO:0042340
neutrophil activation GO:0042119
leukocyte degranulation GO:0043299
granulocyte activation GO:0036230
neutrophil mediated immunity GO:0002444
glycosaminoglycan catabolic process GO:0006026

Граф с 5 самыми значимыми GO terms

graph



Интерпретация результатов Все белки с данными ID участвуют в метаболизме производных углеводов. Узлы полученного графа связаны отношениями принадлежности к биологическим процессам "is a".

2. String

Получившийся граф

graph



Наличие 3D-структур указано для всех узлов (в Legend - "filled nodes")?

Узлы моего графа связаны всеми типами взаимодействий, представленными в легенде, т. е. присутствуют все варианты известных, предсказанных и прочих взаимодействий.

COOCCURRENCE

COOCCURRENCE


По картинке выше можно сказать, что все выбранные белки 100% консервативны в группе опистоконт. Кстати, очень интересно!! У опистоконт вообще, судя по литературе, большая доля высоко консервативных белков. Из эукариот HEXDC встречается только у Guillardia theta, но часто - у бактерий, и там консервативность очень низкая. Можно сделать вывод, что, возможно, есть консервативные домены, формирующие, например, активный центр белка, а остальной аминокислотный состав варьирует в зависимости от функционального диапазона или внутриклеточной локализации белков. Дизруптивный отбор среди бактерий (?). Похожая история с NEU1. Никаких из данных белков нет у Thermodesulfobacteriaceae и Deferribacteraceae, это может быть связано с типом метаболизма (это автотрофы, что видно из названия семейств).

COEXPRESSION (интенсивность цвета квадратика указывает на степень достоверности коэкспрессии - от 0 (пусто) до 1 (черный))

graph

Отношения коэкспрессии у человека относительно большие для CTSA и GLB1, слабее - у CTSA и HEXA, у GLB1 и HEXB. Видим паттерн: часто гены, у которых наблюдается коэкспрессия с другими, строго определенные (это вертикальные и горизонтальные полоски из квадратиков). У других же видов больше генов вступают в отношения коэкспрессии, но все они слабые, и также коэкспрессия CTSA и GLB1 выражена слабее, чем у человека.

3. Human Protein Atlas

Для изучения взят белок CTSA (Cathepsin A). Этот защитный белок, по-видимому, необходим как для активности бета-галактозидазы и нейраминидазы. Он связывается с этими ферментами и способствует их стабильности и активности. Этот белок также является карбоксипептидазой и может деамидировать тахикинины.
Ген, который его кодирует, относится к семейству пептидаз S10 сериновых карбоксипептидаз. Альтернативный сплайсинг приводит к множественным вариантам транскриптов, по крайней мере, один из которых кодирует предшественник белка, который протеолитически обрабатывается с образованием двух цепей, которые содержат гетеродимерный активный фермент. Этот фермент обладает деамидазной, эстеразной и карбоксипептидазной активностями и действует как каркас в лизосомальном мультиферментном комплексе. Мутации в этом гене связаны с галактозиалидозом.

TISSUE
Больше всего CTSA обнаруживается в тканях органов эндокринной системы, особенно в надпочечниках, если рассматривать его как РНК.

graph


Во многих органах экспрессия CTSA высока, но только в надпочечниках обнаруживается очень высокий уровень экспрессии мРНК.

graph

В надпочечниках больше всего CTSA обнаруживается 50% в кортикальных клетках, 40% в медуллярных клетках и 10% в клетках других типов стабильно у всех описанных в данном разделе пациентов.

graph




CELL
CTSA локализован внутриклеточно внутри везикул: эндосом, пероксисом, лизосом, липидных капель.

graph


BRAIN ATLAS
В мозге человека наиболее высокая экспрессия CTSA (РНК) наблюдается в коре БП, однако едва ли он специфичен для какого-либо участка мозга.
А вот в мозолистом теле и гипофизе его не нашли!

graph