Gene ontology
GO Enrichment Analysis
1. В моем файле "list5" было 10 ID.
2. Все они участвовали в анализе обогащения.
3. В выдаче оказалось 15 GO terms с FDR P<0.05.
4. Десять самых значимых:
oxidation-reduction process (GO:0055114) small molecule catabolic process (GO:0044282) organic hydroxy compound metabolic process (GO:1901615) cellular aldehyde metabolic process (GO:0006081) small molecule metabolic process (GO:0044281) alcohol catabolic process (GO:0046164) amino-acid betaine biosynthetic process (GO:0006578) organic hydroxy compound catabolic process (GO:1901616) primary alcohol metabolic process (GO:0034308) 81 alcohol metabolic process (GO:0006066)5. 5 самых значимых GO terms отмечены на Рис. 1, полученном с помощью QuickGO.
6. Между приведенными на рисунке узлами имеются только "is a" отношения. Например, small molecule catabolic относится к small molecule metabolic.
7. Все полученные GO terms относятся к различным метаболическим процессам, причем в основном к метаболизму этанола. Все 15 terms делятся на 4 группы: amino-acid betaine biosynthetic process, cellular aldehyde metabolic process, ethanol catabolic process и ethanol oxidation.
Human protein atlas
1. Я выбрал белок RGN.
2. Регукальцин - высоко консервативный, Ca-связывающий белок, вероятно играет важную роль в гомеостазе кальция. Экспрессируется, в основном, в печени и надпочечниках, однако обнаруживается и во многих других тканях. Является маркером старения (с возрастом его становится меньше). Благодаря альтернативному сплайсингу существуют различные варианты транскриптов гена RGN.
3. Данный белок не специфичен для какого-либо региона мозга. Он экспрессируется везде, однако уровень экспрессии в мозжечке немного выше, чем в остальных регионах (см. Рис. 2).
4. В клетке RGN локализован в нуклеоплазме (см. Рис. 3).
5. Как видно из Рис. 4, в основном RGN экспрессируется в надпочечниках и печени, при этом в надпочечниках белка обнаруживается больше, чем РНК, а в печени высокий уровень и того, и другого.
6. Объединение данных из трех транскриптомных датасетов (HPA, GTEx, FANTOM5) подтверждает, что РНК RGN преимущественно обнаруживается в печени и надпочечниках (см. Рис. 5).
String
1. Полученный граф приведен на Рис. 6.
2. Наличие 3D-структур указано для всех 10 узлов.
3. Половина белков не связаны с другими никакими связями, белки ALDH1B1, ALDH3A2 и ALDH2 связаны между собой гомологией, совместными упоминаниями в статьях (textmining evidence), коэкспрессией и взаимодействием, подтвержденным курируемыми базами данных. Кроме того, ALDH2 и ALDH1B1 редко встречаются друг без друга в геномах (gene co-occurrence). Белки CEL и LIPA связаны взаимодействием, подтвержденным курируемыми базами данных, совместными упоминаниями в статьях, а также коэкспрессией.
Граф с большим числом различных связей доступен на Рис. 9. Там не связаны ни с какими белками только два, а также, например, между ALDH-белками добавились новые взаимодействия вроде совместной локализации генов в геномах.
4. Все данные белки высоко консервативны у Metazoa, при этом белки ALDH1B1, ALDH2, ALDH3A2, ALDH9A1 и ALDH7A1 достаточно консервативны практически у всех организмов, включая бактерий и архей, а также часто представлены (или не представлены) вместе, что свидетельствует о функциональной связи между данными белками (см. Рис. 7).
5. Коэкспрессия данных белков у человека и других организмов представлена на Рис. 8. В целом, высокой коэкспрессии между белками не наблюдается, везде коэкспрессия меньше 0.2. Хоть какая-то коэкспрессия есть у белков, взаимодействия между которыми были показаны на Рис. 6.