Базы данных STRING и Reactome

STRING

Для анализа мне был выдан список из 40 ID генов, полный список вы можете увидеть по ссылке ссылке. Пробежавшись по нему глазками, я узнал только два белка- MAOA и MAOB, это ферменты моноаминоксидазы, осуществляющие окислительное дезаминирование моноаминов.

Для начала воспользуемся датабазой STRING. Она позволяет найти некоторые взаимосвязи между белками (используя информацию из других баз данных) и выражает их в форме графа. Загрузим наши ID в STRING и посмотрим что он выдаст интересного. Исходный граф не очень хорошо понимается из-за избытка представленной информации, поэтому я сразу попробовал разбить его на кластеры используя встроенный функционал STRING. Я использовал алгоритм MCL clustering, т.к. судя по описанию, он должен находить оптимальное число кластеров и по ним распределять все белки. У него есть один параметр- inflation density. Он как-то связан с числом получающихся кластеров, чем больше этот параметр, тем больше кластеров в итоге получится. Я его покрутил и остановился на значении 3, т.к. при нем не образовывалось кластеров, с одним белком в составе (по идее такие кластеры не очень информативные, поэтому я старался их количесто минимизировать). Полученный граф представлен на рис. 1.

Рис. 1. Граф построенный STRING с разбиением на 3 кластера.

Посмотрим что содержится в образовавшихся кластерах:

Ну вроде из сильно интересного все, можно было попробовать другие способы кластеризации, но там +- похожая картина получается, только кластеры отсоединяются в разном порядке (ну и всегда много кластеров с одним представителем, что не есть хорошо).

Reactome

Далее я решил изучить свой набор белков с помощью базы данных Reactome, т.к. в ней легче понимать функциональное разнообразие белков, чем смотря на граф. Полная выдача представлена на рис. 2.

Рис. 2. Диаграмма функций данных белков.

Мы видим, что (как и ожидалось), наши белки разбросаны по большому количеству групп. Более детальная информация представлена на рис. 3-6.

Рис. 3. Нервная система.

Здесь представлены белки, ответственные за метаболизм серотонина. Если быть точнее, то здесь находится уже упоминавшаяся в начале работы моноаминоксидаза.

Рис. 4. Метаболизм.

Здесь находится самое большое количество белков с очень разнообразными функциями, включая ферменты ответственные за метаболизм углеводов, аминокислот, некоторых витаминов и гема, подробно говорить про каждую группу здесь мне кажется не имеет смысла.

Рис. 5. Метаболизм белков.

Здесь есть только пара белков, ответственных за деградацию митохондриальных белков

Рис. 6. Локализация белков.

Здесь мы видим белки, которые ответственны за импорт в пероксисомы

В целом, результаты совпали с анализом при помощи STRING- у наших белков множество непохожих функций.