Практикум 6

Входные данные

Для выполнения этого задания мне был предложен список ID генов человека. В наборе всего 22 гена: CD320, AMN, CUBN, MTRR, ABCD4, PRSS1, LRP2, MMAB, CBLIF, CTRB2, MTR, LMBRD1, TCN2, TCN1, CTRB1, MMUT, LDLRAP1, MMAA, MMACHC, ABCC1, MMADHC, PRSS3.

Анализ обогащения терминами GO

База данных GO (Gene Ontology) - ориентированный ациклический граф биологических терминов, где каждый термин связан с одними или несколько другими терминами через различного типа отношения.

Основные группы терминов Gene Ontology:

• Молекулярные функции (англ. molecular function) — специфическая активность генного продукта на молекулярном уровне, например, связывание углеводов или АТФазная активность.

• Биологические процессы (англ. biological process) — сложные явления, необходимые для жизнедеятельности организмов и происходящие благодаря осуществлению последовательности молекулярных функций, например, митоз или биосинтез пуринов.

• Клеточные компоненты (англ. cellular component) — части клетки или внеклеточного пространства, где осуществляется функция генного продукта, например, ядро или рибосома.

Проведен анализ с помощью PANTHER Overrepresentation Test с использованием точного теста Фишера и поправки Бонферрони на множественную проверку гипотез.

Bonferroni count: 8995

Рис. 1. Результат анализа обогащения терминами PANTHER Overrepresentation Test, отсортированный по p-value < 0.05

Анализ обогащения терминами показывает, что белки генов из набора участвуют в следующих процессах:

1. Процесс метаболизма кобаламина;

2. Транспортировка кобаламина;

3. Транспорт ионов кобальта;

4. Процесс метаболизма гомоцистеина;

5. Рецептор-опосредованный эндоцитоз.

Эти находки оказались лучшими по p-value.

Полная таблица обогащения терминами по биологическим процессам с поправкой на p-value < 0.05

Результаты анализа PANTHER Overrepresentation Test совпали с описаниями белков, которые были найдены на UniProt, что подтверждает высокую точность классификации функциональных терминов в Gene Ontology.

Можно сделать вывод, что основноя функция - процесс метаболизма кобаламина (витамина В12). Это подтверждается участием белков генов в транспортировке кобаламина и ионов кобальта (кобальт входит в структуру кобаламина и выступает в роли кофактора, то есть участвует в работе определённых ферментов, необходимых для метаболизма).

Анализ гена ABCD4 с помощью Human Protein Atlas

Human Protein Atlas (HPA) — это всеобъемлющий биоинформатический ресурс, целью которого является изучение протеома человека и предоставление подробной информации об экспрессии и локализации белков в различных тканях и органах. Он предоставляет данные об их распределении в нормальных и опухолевых тканях, субклеточной локализации, а также прогностической значимости для различных заболеваний. Human Protein Atlas интегрирует транскриптомные и протеомные данные, дополняя их микроскопическими изображениями и клиническими ассоциациями, что делает его ключевым ресурсом для биомедицинских исследований.

Рис. 2. Информация из HPA о ABCD4
Рис. 3. Локализация экспрессии гена ABCD4

Можно видеть, что экспрессия РНК происходит во всех органах, но максимальная экспрессия происходит в женских половых органах, в большей степени в маточных трубах, и в желудочно-кишечном тракте, а если точнее - в тонкой и двенадцатиперстной кишке. Касаемо белков можно сказать, что экспрессия белков почти также происходит во всех органах, за исключением глаза и проксимального отдела пищеварительного тракта. Максимальная экспрессия белков происходит в почках и мочевом пузыре, в органах женской (в основном в маточных трубах) и мужской половой системы (в основном в яичке).

Рис. 4. Локализация экспрессии белков, кодируемых ABCD4 - гистограмма.

Рис. 4. представляет собой гистограмму, на котором можно удобно проанализировать уровень экспрессии продуктов (белков) гена ABCD4. В основном это почки, яичко и маточные трубы.

Выводы

Анализ генов, связанных с транспортом кобаламина, в базах данных GO и UniProt подтвердил их ключевую роль в биосинтезе кобаламина. База данных Human Protein Atlas (HPA) показала тканевую специфичность экспрессии (например, ABCD4 — максимальная активность в почках и мужских и женских половых органах (в основном в яичке и маточных трубах)). Данные GO выявили обогащение терминами, связанными с метаболизмом кобаламина, а UniProt предоставил детали о локализации и функциях белков. Вместе эти базы данных позволили системно охарактеризовать гены и их биологическую значимость.