Практикум 6

Для выполнения данного практикума мне был предоставлен список ID генов человека: Файл

В моём списке 176 генов. Вероятно, эти гены как-то между собой связаны раз оказались в одном списке. Однако список довольно большой, и с ходу что-то сказать об этих генах непросто.

Целью данного практикума было проанализировать данный список при помощи различных сервисов, а также охарактеризовать биологические процессы, молекулярные функции и пути, в которые вовлечены эти гены.

Анализ обогащения терминами GO с помощью сервиса PANTHER

Для начала я решила проанализировать список при помощи базы данных GO (Gene Ontology). Эта база данных представляет собой граф биологических терминов. Эта база данных позволяет понять, в каких процессах участвуют белки, закодированные в этих генах.

Для начала я загрузила список ID и выставила параметры: использование точного теста Фишера и использование поправки Бонферонни на множественное тестирование. В результате была получена таблица находок, которую я отсортировала по p-value с поправкой Бонферонни. Всего таблица содержит 176 терминов, как ни странно, повторяющихся нет. Полную таблицу можно посмотреть по ссылке:

Таблица с выдачей

Table
Рис. 1 Наиболее значимые находки в выдаче

Судя по таблице, список представляет из себя функционально связанную группу генов липидного обмена. Гены участвуют в β-окислении, синтезе жирных кислот и метаболизме эйкозаноидов.

The Human Protein Atlas

Дальше я решила поработать с ещё одной очень интересной программой - The Human Protein Atlas. Она позволяет получить информацию об экспрессии РНК и белка, причем в довольно понятном интерактивном виде.

На вход данной программе передается ID гена, но, поскольку в моём распоряжении их множество, я решила детально изучить один ген из списка, чтобы понять, какую дополнительную информацию о нём можно получить. Я выбрала ген HADHA, он кодирует альфа-субъединицу митохондриального трифункционального белка, который критически важен для β-окисления длинноцепочечных жирных кислот. Анализ в HPA покажет, в каких тканях экспрессируется этот белок, где он локализуется в клетке и как его экспрессия может быть связана с заболеваниями.

В результате поиска обнаружилось, что этот белок относится к ферментам, участвующим в метаболических путях, а также связан с человеческими заболеваниями и является возможной мишенью для лекарств.

Также в выдаче представлено описание функции белка из Uniprot. Если кратко, ген HADHA кодирует ключевой фермент митохондриального β-окисления, который выполняет две критически важные функции: расщепление длинноцепочечных жирных кислот для производства энергии и синтез кардиолипина - незаменимого фосфолипида для работы митохондриальной дыхательной цепи и апоптоза.

Также данная программа позволяет узнать информацию и локализации экспрессии РНК:

Table
Рис. 2 Уровень экспрессии РНК-продукта гена

Данный белок имеет внутриклеточную локализацию. Интересно, что наибольшая экспрессия РНК наблюдается в мышечных тканях, а также в печени. Эти данные полностью логически сопоставляются с указанной функцией белкового продукта выбранного гена.

Более наглядно локализацию экспрессии можно рассмотреть на анатограмме:

Table
Рис. 3 Уровни экспрессии РНК и белка в различных тканях в виде анатограммы. Красным цветом отмечены ткани, где наблюдается экспрессия. Уровень экспрессии отображается насыщенностью цвета.

Заметим, что белок HADHA имеет повышенную экспрессию в печени, почках, сердце, а также в мышцах. Это полностью соответствует его функции: эти ткани являются главными "энергетическими станциями" организма и активно используют жирные кислоты в качестве источника энергии.

Субклеточная локализация:

Table
Рис. 4 Субклеточная локализация

Белок HADHA локализуется в митохондриях, что и ожидалось для фермента β-окисления.

Общие выводы

Я проанализировала выданный мне список ID генов при помощи GO. В результате стало понятно, что список генов неслучаен: все они связаны с метаболизмом жирных кислот и липидов. То есть данная база данных дала общее представление о взяимосвязи этих генов.

Далее они из генов был проанализировал в The Human Protein Atlas. В итоге я узнала локализацию экспресии РНК и белка, обнаружила некоторые интересные факты.

В целом, обе базы очень информативны и удобны в использовании.