Работа с базой данных KEGG
Анализ обогащения списка генов
Вся работа выполнялась с помощью языка программирования R.
Список генов, их символьные обозначения и Entrez ID показаны в табл. 1.
ID генов были переведены в Entrez ID, после чего проводился анализ обогащения биологическими путями из базы данных KEGG с помощью точного теста Фишера.
Файл скрипта формата R доступен по
ссылке.
Скрипт скачивает все доступные биологические пути в базе данных KEGG, описанные для человека, их оказалось 186. Из этих биологических путей список генов оказался обогащен только путем
KEGG_TERPENOID_BACKBONE_BIOSYNTHESIS (ссылка на аннотацию пути в KEGG), adjusted p-value = 2.8e-05. 14 из 15 выбранных генов являются генами, участвующими в этом пути.
Данный результат означает, что анализируемый список генов значимо пересекается со списком генов, вовлеченных в синтез остова различных терпеноидов (у человека это мевалонатный путь).
Если все гены из анализируемого списка вовлечены в какой-либо процесс, то полученный результат означал бы связь этого процесса с синтезом терпенов.
Если большая часть генов (но не все) ассоциирована с синтезом терпенов (мы наблюдаем это из результатов анализа обогащения) и все гены в списке связаны между собой неизвестной функцией, то можно было бы предполагать, что этой неизвестной функцией является синтез терпенов. Другими словами, это означало бы, что обнаружены новые гены, ассоциированные с синтезом терпенов.
Таблица 1. Соответствие символьных обозначений генов и их Entrez ID
Gene name |
Entrez ID |
CHURC1-FNTB |
100529261 |
COQ2 |
27235 |
COQ3 |
51805 |
COQ5 |
84274 |
COQ6 |
51004 |
COQ7 |
10229 |
FNTA |
2339 |
FNTB |
2342 |
HMGCS2 |
3158 |
ICMT |
23463 |
NQO1 |
1728 |
PCYOX1 |
51449 |
PDSS1 |
23590 |
PDSS2 |
57107 |
ZMPSTE24 |
10269 |