Для работы мне были выданы 5 идентификаторов: ALDH1A1; TKFC; GLYCTK; ALDOB; KHK. В этом анализе я пошел по пути разбора их метаболических функций и взаимодействий, для чего использовал поиск по базам данных STRING и PAN-GO.
1)STRING
STRING – база данных белок-белковых взаимодействий и ассоциаций по их функциям. Данные о белок-белковых взаимодействиях и ассоциациях берутся из непосредственных экспериментальных данных, также взаимодействия могут предсказываться на основе автоматического поиска по тексту статей, коэкспрессии белков и взаимодействия ортологов исследуемых белков в модельных организмах. При поиске идентификаторов белков по STRING можно получить информацию об их взаимодействиях и ассоциациях(с указанием способа предсказания) и их взаимодействиях и ассоциациях с другими белками. Также можно смотреть ассоциированные статьи, пути KEGG, молекулярно-биологические функции, ассоциированные биологические процессы и т.д.
2)PAN-GO
PAN-GO – база данных генов и белков человека(гибрид ежа с ужом, то есть PANTHER с GO), содержащая их семейства, которые выделяются по функциям(сами себя называют человеческим функциономом). Гены и белки разделяются(и можно так искать) по молекулярно-биологическим функциям, метаболическим путям и локализациям в клетке. Можно использовать анализ обогащения терминами при поиске(есть два варианта тестирования: точный тест Фишера и биномиальный, с двумя вариантами поправок на множественность: через FDR и поправка Бонферрони(плюс можно отключить поправки на множественность)).
Вот пистолеты уж блеснули, гремит о шомпол молоток, а тем временем я загнал свои пять идентификаторов в поиск PAN-GO и провел обогащение терминами(искал по разделу базы с метаболическими путями) с импользованием точного теста Фишера и поправки по FDR. В результате нашелся один значимый термин - carbohydrate metabolic process. С carbohydrate metabolic process ассоциированы ALDOB, KHK, TKFC. Есть еще огромное количество терминов, не прошедших порог, среди лучших из них как раз термины, связанные с катаболизмом углеводов(см. Рис.4 и Рис.5). Подробнее на выдачу с p-value, Fold enrichment и тд можно посмотреть здесь Также нужно отметить, что по многим терминам нашлась почему-то только KHK(кетогексокиназа). Таким образом анализ по PAN-GO подтвердил уже полученные результаты: эти белки в основном связаны именно с катаболизмом углеводов в общем и фруктозы в частности. А что может быть лучше перед сном, чем подтверждение полученных результатов?
3)Выводы
Таким образом, поиск по двум базам данных позволил определить, что представленный мне набор белков – ферменты, связанные с катаболизмом фруктозы(с особенностями в виде ретинальдегидрогеназы), и почти между всеми из них выявлены ассоциации(кроме ретинальдегидрогеназы).