В данной работе дан список из 44 генов человека. Требуется с помощью различных баз данных выяснить их роль в жизнедеятельности клетки и организма в целом.
База данных GO (Gene Ontology) представляет из себя ориентированный ациклический граф, в узлах которого находятся биологические термины (GO-термины), а ребра показывают различные отношения между биологическими терминами. Кроме прямых отношений учитываются также и логически вытекающие из них. В GO выделяют три группы биологических терминов: молекулярные функции (специфические функции продукта данного гена на молекулярном уровне),биологические процессы (комплексные явления в живых организмах, в которых учавствуют продукты многих генов) и клеточные компоненты (часть клетки или межклеточной среды, в которой локализован или функционирует продукт данного гена). Кроме этого, в GO содержатся утверждения, связывающие термины GO и конкретный ген, полученные на основе экспериментальных данных. На GO реализовано множестов сервисом, с помощью которых можно анализировать, визуализировать и осуществлять поиск терминов (например, PANTHER). Для выяснения функций интересующих нас генов воспользуемся сервисом PANTHER и проведем анализ обогащения терминами по всем трем группам терминов. В качестве статистического критерия воспользуемся точным тестом Фишера с поправкой на множественное тестирование FDR. На Рис. 1-3 представлены результаты этого поиска.
Исходя из полученных данных видно, что мы имеем дело с генами белков, имеющими отношение к биосинтезу и транспорту желчных кислот. В клетке продукты генов в основном локализованы в эндоплазматической сети, плазматической мембране, цитозоле и пероксисомах. Белки-транспортеры желчных кислот находятся в мембране, а,как известно, все мембранные белки синтезируются на рибосомах, связанных с шероховатой эндоплазматической сетью и сразу встраиваются в ее мембрану. В пероксисомах, скорее всего, происходят оксилительные реакции ферментов биосинтеза желчных кислот, а в цитозоле - остальные ферментативные реакции.
База данных Human Protein Atlas содержит информацию о всех известных на данный момент белках человека, разделенную на следующие категории:
Для детального анализа я выбрал ген CYP8B1. Этот ген кодирует белок цитохром P450 монооксигеназу (Cytochrome P450 family 8 subfamily B member 1). Этот белок встроен в мембрану эндоплазматического ретикулума и участвует в процессах синтеза желчных кислот и других стероидных производных, а также в метаболизме лекарств. Данный белок экспрессируется главным образом в печени, и немного в почках. Данный белок является маркером рака почек и печени. На Рис. 4 представлена его структура, предсказанная alphafold.