Gene Ontology.
Цель работы - выполнить работу
1. GO Enrichment Analysis
Файл: list32.txt
В списке 14 ID. Вот они сверху вниз:
ID:
AGA
CTSA
ENGASE
FUCA1
FUCA2
GALNS
GLB1
GNS
HEXA
HEXB
HEXDC
NAGA
NEU1
12 из 13 ID участвовало в результате в анализе обогащения. Их
меньше, чем было в списке изначально, потому что, возможно, есть несоответствия ID между
различными базами данных. Сервис указал количество прошедших в итоге ID и
выдал отчет по непрошедшим.
В выдаче оказалось 83 GO terms (остальные имели p-value > 0.05)
Список десяти самых значимых GO terms:
carbohydrate derivative catabolic process GO:1901136
carbohydrate derivative metabolic process GO:1901135
liposaccharide metabolic process GO:1903509
glycolipid metabolic process GO:0006664
keratan sulfate catabolic process GO:0042340
neutrophil activation GO:0042119
leukocyte degranulation GO:0043299
granulocyte activation GO:0036230
neutrophil mediated immunity GO:0002444
glycosaminoglycan catabolic process GO:0006026
Граф с 5 самыми значимыми GO terms
Интерпретация результатов Все белки с данными ID участвуют в метаболизме производных углеводов. Узлы полученного графа связаны отношениями принадлежности к биологическим процессам "is a".
2. String
Получившийся граф
Наличие 3D-структур указано для всех узлов (в Legend - "filled nodes")?
Узлы моего графа связаны всеми типами взаимодействий, представленными в легенде, т. е. присутствуют все варианты известных, предсказанных и прочих взаимодействий.
COOCCURRENCE
По картинке выше можно сказать, что все выбранные белки 100% консервативны в группе опистоконт. Кстати, очень интересно!! У опистоконт вообще, судя по литературе, большая доля высоко консервативных белков. Из эукариот HEXDC встречается только у Guillardia theta, но часто - у бактерий, и там консервативность очень низкая. Можно сделать вывод, что, возможно, есть консервативные домены, формирующие, например, активный центр белка, а остальной аминокислотный состав варьирует в зависимости от функционального диапазона или внутриклеточной локализации белков. Дизруптивный отбор среди бактерий (?). Похожая история с NEU1. Никаких из данных белков нет у Thermodesulfobacteriaceae и Deferribacteraceae, это может быть связано с типом метаболизма (это автотрофы, что видно из названия семейств).
COEXPRESSION (интенсивность цвета квадратика указывает на степень достоверности коэкспрессии - от 0 (пусто) до 1 (черный))
Отношения коэкспрессии у человека относительно большие для CTSA и GLB1, слабее - у CTSA и HEXA, у GLB1 и HEXB. Видим паттерн: часто гены, у которых наблюдается коэкспрессия с другими, строго определенные (это вертикальные и горизонтальные полоски из квадратиков). У других же видов больше генов вступают в отношения коэкспрессии, но все они слабые, и также коэкспрессия CTSA и GLB1 выражена слабее, чем у человека.
3. Human Protein Atlas
Для изучения взят белок CTSA (Cathepsin A).
Этот защитный белок, по-видимому, необходим как для активности бета-галактозидазы и нейраминидазы.
Он связывается с этими ферментами и способствует их стабильности и активности.
Этот белок также является карбоксипептидазой и может деамидировать тахикинины.
Ген, который его кодирует, относится к семейству пептидаз S10 сериновых карбоксипептидаз.
Альтернативный сплайсинг приводит к множественным вариантам транскриптов, по крайней мере,
один из которых кодирует предшественник белка, который протеолитически обрабатывается с образованием двух цепей,
которые содержат гетеродимерный активный фермент. Этот фермент обладает деамидазной,
эстеразной и карбоксипептидазной активностями и действует как каркас в лизосомальном мультиферментном комплексе.
Мутации в этом гене связаны с галактозиалидозом.
TISSUE
Больше всего CTSA обнаруживается в тканях органов эндокринной системы, особенно в надпочечниках, если рассматривать его
как РНК.
Во многих органах экспрессия CTSA высока, но только в надпочечниках обнаруживается очень высокий уровень экспрессии мРНК.
В надпочечниках больше всего CTSA обнаруживается 50% в кортикальных клетках, 40% в медуллярных клетках и 10% в клетках других типов стабильно у всех описанных в данном разделе пациентов.
CELL
CTSA локализован внутриклеточно внутри везикул: эндосом, пероксисом, лизосом, липидных капель.
BRAIN ATLAS
В мозге человека наиболее высокая экспрессия CTSA (РНК) наблюдается в коре БП, однако едва ли он специфичен для какого-либо участка мозга.
А вот в мозолистом теле и гипофизе его не нашли!