УЧЕБНЫЙ САЙТ АРТЕМА МУРАВЛЕВА

Практикум 6

Для работы мне были выданы 5 идентификаторов: ALDH1A1; TKFC; GLYCTK; ALDOB; KHK. В этом анализе я пошел по пути разбора их метаболических функций и взаимодействий, для чего использовал поиск по базам данных STRING и PAN-GO.

1)STRING

STRING – база данных белок-белковых взаимодействий и ассоциаций по их функциям. Данные о белок-белковых взаимодействиях и ассоциациях берутся из непосредственных экспериментальных данных, также взаимодействия могут предсказываться на основе автоматического поиска по тексту статей, коэкспрессии белков и взаимодействия ортологов исследуемых белков в модельных организмах. При поиске идентификаторов белков по STRING можно получить информацию об их взаимодействиях и ассоциациях(с указанием способа предсказания) и их взаимодействиях и ассоциациях с другими белками. Также можно смотреть ассоциированные статьи, пути KEGG, молекулярно-биологические функции, ассоциированные биологические процессы и т.д.

Я внес выданные мне идентификатор, запустил поиск в STRING, выбрав как организм человека. Для всех белков были найдены ассоциации с другими из списка, кроме ALDH1A1(см. Рис.1). Также посмотрел ассоциации с другими белками(Рис.2).

Ошибка
Рис.1 | Ассоциации между исследуемыми белками в STRING
Ошибка
Рис.2 | Ассоциации между исследуемыми белками и другими белками в STRING
Заглянул также в более подробную информацию и ссылки. Увидел, например, что он относится к кластеру углеводного и пируватного метаболизма(кластер ассоциаций STRING, он большой, привожу ссылкой). Посмотрел также ссылки на базу данных Reactome pathways(все же хочется разобраться подробнее, что там за метаболические пути, в которых этот дружный набор участвует). Мне выдались как варианты катаболизм фруктозы и нарушения метаболизма углеводов. На Рис.3 можно подробне рассмотреть схему с катаболизмом фруктозы. Собственно говоря, описанные белки – участники катаболизма фруктозы и гликолиза(видимо поэтому и в запись о нарушениях попали). GLYCTK это глицераткиназа, KHK – кетогексокиназа, TKFC – дигидроксиацетонкиназа, ALDOB – фруктозобисфосфатальдолаза, ALDH1A1 – альдегиддегидрогеназа. Это можно прочитать и в STRING, и в Reactome pathways. Нужно еще уточнить, что ALDH1A1 видимо не отобразилась со связями с остальными т.к. в реальности в основном это ретинальдегидрогеназа, которая, правда, способна окислять и другие альдегиды, то есть может и в гликолизе участовать. Интересное наблюдение. Думаю, на этом перейдем к следующей базе данных.

Ошибка
Рис.3 | Катаболизм фруктозы с выделенными исследуемыми белками в Reactome pathways

2)PAN-GO

PAN-GO – база данных генов и белков человека(гибрид ежа с ужом, то есть PANTHER с GO), содержащая их семейства, которые выделяются по функциям(сами себя называют человеческим функциономом). Гены и белки разделяются(и можно так искать) по молекулярно-биологическим функциям, метаболическим путям и локализациям в клетке. Можно использовать анализ обогащения терминами при поиске(есть два варианта тестирования: точный тест Фишера и биномиальный, с двумя вариантами поправок на множественность: через FDR и поправка Бонферрони(плюс можно отключить поправки на множественность)).

Вот пистолеты уж блеснули, гремит о шомпол молоток, а тем временем я загнал свои пять идентификаторов в поиск PAN-GO и провел обогащение терминами(искал по разделу базы с метаболическими путями) с импользованием точного теста Фишера и поправки по FDR. В результате нашелся один значимый термин - carbohydrate metabolic process. С carbohydrate metabolic process ассоциированы ALDOB, KHK, TKFC. Есть еще огромное количество терминов, не прошедших порог, среди лучших из них как раз термины, связанные с катаболизмом углеводов(см. Рис.4 и Рис.5). Подробнее на выдачу с p-value, Fold enrichment и тд можно посмотреть здесь Также нужно отметить, что по многим терминам нашлась почему-то только KHK(кетогексокиназа). Таким образом анализ по PAN-GO подтвердил уже полученные результаты: эти белки в основном связаны именно с катаболизмом углеводов в общем и фруктозы в частности. А что может быть лучше перед сном, чем подтверждение полученных результатов?

Ошибка
Рис.4 | Лучшие не прошедшие порог термины в PAN-GO(часть 1, самые лучшие)
Ошибка
Рис.5 | Лучшие не прошедшие порог термины в PAN-GO(часть 2, не самые лучшие)

3)Выводы

Таким образом, поиск по двум базам данных позволил определить, что представленный мне набор белков – ферменты, связанные с катаболизмом фруктозы(с особенностями в виде ретинальдегидрогеназы), и почти между всеми из них выявлены ассоциации(кроме ретинальдегидрогеназы).