База данных Reactome
С помощью базы данных Reactome был проведен анализ функционального обогащения генов из списка, содержащего их символьные обозначения. Для анализа был использован инструмент Analyse gene list с сайта базы данных.
Параметры запуска

Был выбран параметр ‘Project to human’, при этом выдача приводилась только для человека.
Разработчики не рекомендуют выбирать параметр ‘Include Interactors’ [1]. Он расширяет список путей, среди которых будет проводиться поиск, белок-белковыми взаимодействиями из базы данных IntAct. При этом будут включены не прошедшие проверку Reactome взаимодействия, которые могут не иметь какого-либо биологического значения.
Результаты
Выдача программы - результат функционального обогащения, с помощью которого список генов можно ассоциировать с биологическими путями по их представленности. Для анализа Reactome использует гипергеометрический тест, чтобы выявить, обогащены ли какие-либо биологические пути во входных данных. Таким образом, можно получить ответ на вопрос, содержат ли данные больше белков, участвующих в некотором пути, чем можно было бы ожидать. C выдачей в форме таблицы можно ознакомиться по ссылке. Для удобства привожу несколько первых строчек таблицы ниже.
| Pathway name | #Entities found | #Entities total | Entities ratio | Entities pValue | Entities FDR | #Reactions found | #Reactions total | Reactions ratio |
|---|---|---|---|---|---|---|---|---|
| Cholesterol biosynthesis | 19 | 77 | 0,005 | 1E-16 | 8,88E-16 | 26 | 35 | 0,003 |
| Activation of gene expression by SREBF (SREBP) | 22 | 71 | 0,005 | 1E-16 | 8,88E-16 | 22 | 42 | 0,003 |
| Regulation of cholesterol biosynthesis by SREBP (SREBF) | 22 | 87 | 0,006 | 1E-16 | 8,88E-16 | 22 | 52 | 0,004 |
| Metabolism of steroids | 30 | 331 | 0,022 | 1E-16 | 8,88E-16 | 48 | 245 | 0,018 |
| Metabolism of lipids | 30 | 1446 | 0,096 | 1E-16 | 8,88E-16 | 48 | 955 | 0,069 |
| Metabolism | 30 | 3639 | 0,241 | 5E-15 | 2,73E-14 | 48 | 2250 | 0,163 |
| Cholesterol biosynthesis via desmosterol | 4 | 14 | 0,001 | 3E-08 | 1,67E-07 | 4 | 4 | 0,000 |
| Cholesterol biosynthesis via lathosterol | 4 | 14 | 0,001 | 3E-08 | 1,67E-07 | 4 | 4 | 0,000 |
Описание некоторых полей таблицы.
- Pathway name.
- Entities found: количество функциональных единиц (нуклеиновых кислот, белков, комплексов, малых молекул и др.), участвующих в данном биологическом пути и при этом связанных с входными данными.
- Entities total: общее количество функциональных единиц, участвующих в данном биологическом пути.
- Entities ratio: число функциональных единиц, участвующих в данном биологическом пути, поделенное на общее количество функциональных единиц для всех видов.
- Entities pvalue: результат статистического теста для перепредставленности.
- Entities FDR: p-value после поправки на множественное тестирование.
- Reactions found: количество реакций в пути, представленных хотя бы одной функциональной единицей, связанной с входными данными.
- Reactions Total: общее количество реакций, в которых участвуют молекулы выбранного типа.
- Reactions ratio: доля реакций в Reactome, участвующих в данном пути. Рассчитывается как общее количество реакций в пути, разделенное на количество реакций для всех видов.
- Species Name.
Для трех генов: FAXDC2, MAGEA2 и MAGEA2B не было найдено ассоциаций с путями.
Для визуализации результата была представлена схема, отображающая пути, которыми обогащены данные (Рис.1), а также диаграмма Вороного (Рис.2). С помощью схемы можно очень легко проследить, какие именно этапы биологического пути затрагиваются (если смотреть на сайте).


Обсуждение
Как видно из таблицы, анализируемые гены участвуют в метаболизме жиров, а именно биосинтезе и регуляции холестерола (в таблице процессы, связанные с этим путем, покрашены желтым) и активации экспрессии PPAR (Peroxisome proliferator-activated receptor). PPAR-α - транскрипционный фактор, способствующий катаболизму жирных кислот, основной регулятор метаболизма жиров в печени [2]. Также гены значимо обогащены путем, связанным с миелинизацией шванновскими клетками. Эти две функции могут быть связаны, так как миелин содержит значимую долю жиров [3].
+ Крутые штуки Reactome
Помимо таблицы и схем, представленных выше, в выдаче Reactome есть еще много чего интересного. Например, для каждого пути можно посмотреть его диаграмму. Ниже представлена диаграмма метаболизма стероидов (Рис.3).

Также для каждого пути можно получить данные по тому, в каких тканях и на каком уровне экспрессируются гены, участвующие в нем; названия молекул – участников реакций пути; описание пути. Например, для того же метаболизма стероидов:
‘Steroids, defined by a four-ring cyclopenta[a]phenanthrene carbon skeleton, include cholesterol and bile acids and salts, steroid hormones, and vitamin D, three groups of molecules synthesized from it. In this module, pathways for the synthesis of cholesterol from HMG-CoA (hydroxymethylglutaryl-coenzyme A) (Russell 1992), and for its conversion to bile acids and salts (Russell 2003), steroid hormones (Payne & Hales 2004), and vitamin D (Dusso et al. 2005) are annotated, together with the SREBP-mediated regulatory process that normally links the rate of cholesterol synthesis to levels of cellular cholesterol (Brown & Goldstein 2009).’
Для каждого пути можно скачать большой отчет в формате pdf. Можно скачать отчет по всему анализу.
Литераура
[1] https://reactome.org/userguide/analysis
[2] https://en.wikipedia.org/wiki/Peroxisome_proliferator-activated_receptor_alpha
[3] https://en.wikipedia.org/wiki/Myelin