Для выполнения данного практикума мне был предоставлен список ID генов человека: Файл
В моём списке 176 генов. Вероятно, эти гены как-то между собой связаны раз оказались в одном списке. Однако список довольно большой, и с ходу что-то сказать об этих генах непросто.
Целью данного практикума было проанализировать данный список при помощи различных сервисов, а также охарактеризовать биологические процессы, молекулярные функции и пути, в которые вовлечены эти гены.
Анализ обогащения терминами GO с помощью сервиса PANTHER
Для начала я решила проанализировать список при помощи базы данных GO (Gene Ontology). Эта база данных представляет собой граф биологических терминов. Эта база данных позволяет понять, в каких процессах участвуют белки, закодированные в этих генах.
Для начала я загрузила список ID и выставила параметры: использование точного теста Фишера и использование поправки Бонферонни на множественное тестирование. В результате была получена таблица находок, которую я отсортировала по p-value с поправкой Бонферонни. Всего таблица содержит 176 терминов, как ни странно, повторяющихся нет. Полную таблицу можно посмотреть по ссылке:
Судя по таблице, список представляет из себя функционально связанную группу генов липидного обмена. Гены участвуют в β-окислении, синтезе жирных кислот и метаболизме эйкозаноидов.
The Human Protein Atlas
Дальше я решила поработать с ещё одной очень интересной программой - The Human Protein Atlas. Она позволяет получить информацию об экспрессии РНК и белка, причем в довольно понятном интерактивном виде.
На вход данной программе передается ID гена, но, поскольку в моём распоряжении их множество, я решила детально изучить один ген из списка, чтобы понять, какую дополнительную информацию о нём можно получить. Я выбрала ген HADHA, он кодирует альфа-субъединицу митохондриального трифункционального белка, который критически важен для β-окисления длинноцепочечных жирных кислот. Анализ в HPA покажет, в каких тканях экспрессируется этот белок, где он локализуется в клетке и как его экспрессия может быть связана с заболеваниями.
В результате поиска обнаружилось, что этот белок относится к ферментам, участвующим в метаболических путях, а также связан с человеческими заболеваниями и является возможной мишенью для лекарств.
Также в выдаче представлено описание функции белка из Uniprot. Если кратко, ген HADHA кодирует ключевой фермент митохондриального β-окисления, который выполняет две критически важные функции: расщепление длинноцепочечных жирных кислот для производства энергии и синтез кардиолипина - незаменимого фосфолипида для работы митохондриальной дыхательной цепи и апоптоза.
Также данная программа позволяет узнать информацию и локализации экспрессии РНК:
Данный белок имеет внутриклеточную локализацию. Интересно, что наибольшая экспрессия РНК наблюдается в мышечных тканях, а также в печени. Эти данные полностью логически сопоставляются с указанной функцией белкового продукта выбранного гена.
Более наглядно локализацию экспрессии можно рассмотреть на анатограмме:
Заметим, что белок HADHA имеет повышенную экспрессию в печени, почках, сердце, а также в мышцах. Это полностью соответствует его функции: эти ткани являются главными "энергетическими станциями" организма и активно используют жирные кислоты в качестве источника энергии.
Субклеточная локализация:
Белок HADHA локализуется в митохондриях, что и ожидалось для фермента β-окисления.
Общие выводы
Я проанализировала выданный мне список ID генов при помощи GO. В результате стало понятно, что список генов неслучаен: все они связаны с метаболизмом жирных кислот и липидов. То есть данная база данных дала общее представление о взяимосвязи этих генов.
Далее они из генов был проанализировал в The Human Protein Atlas. В итоге я узнала локализацию экспресии РНК и белка, обнаружила некоторые интересные факты.
В целом, обе базы очень информативны и удобны в использовании.