Для выполнения этого задания мне был предложен список ID генов человека. В наборе всего 22 гена: CD320, AMN, CUBN, MTRR, ABCD4, PRSS1, LRP2, MMAB, CBLIF, CTRB2, MTR, LMBRD1, TCN2, TCN1, CTRB1, MMUT, LDLRAP1, MMAA, MMACHC, ABCC1, MMADHC, PRSS3.
База данных GO (Gene Ontology) - ориентированный ациклический граф биологических терминов, где каждый термин связан с одними или несколько другими терминами через различного типа отношения.
Основные группы терминов Gene Ontology:
• Молекулярные функции (англ. molecular function) — специфическая активность генного продукта на молекулярном уровне, например, связывание углеводов или АТФазная активность.
• Биологические процессы (англ. biological process) — сложные явления, необходимые для жизнедеятельности организмов и происходящие благодаря осуществлению последовательности молекулярных функций, например, митоз или биосинтез пуринов.
• Клеточные компоненты (англ. cellular component) — части клетки или внеклеточного пространства, где осуществляется функция генного продукта, например, ядро или рибосома.
Проведен анализ с помощью PANTHER Overrepresentation Test с использованием точного теста Фишера и поправки Бонферрони на множественную проверку гипотез.
Bonferroni count: 8995
Анализ обогащения терминами показывает, что белки генов из набора участвуют в следующих процессах:
1. Процесс метаболизма кобаламина;
2. Транспортировка кобаламина;
3. Транспорт ионов кобальта;
4. Процесс метаболизма гомоцистеина;
5. Рецептор-опосредованный эндоцитоз.
Эти находки оказались лучшими по p-value.
Полная таблица обогащения терминами по биологическим процессам с поправкой на p-value < 0.05
Результаты анализа PANTHER Overrepresentation Test совпали с описаниями белков, которые были найдены на UniProt, что подтверждает высокую точность классификации функциональных терминов в Gene Ontology.
Можно сделать вывод, что основноя функция - процесс метаболизма кобаламина (витамина В12). Это подтверждается участием белков генов в транспортировке кобаламина и ионов кобальта (кобальт входит в структуру кобаламина и выступает в роли кофактора, то есть участвует в работе определённых ферментов, необходимых для метаболизма).
Human Protein Atlas (HPA) — это всеобъемлющий биоинформатический ресурс, целью которого является изучение протеома человека и предоставление подробной информации об экспрессии и локализации белков в различных тканях и органах. Он предоставляет данные об их распределении в нормальных и опухолевых тканях, субклеточной локализации, а также прогностической значимости для различных заболеваний. Human Protein Atlas интегрирует транскриптомные и протеомные данные, дополняя их микроскопическими изображениями и клиническими ассоциациями, что делает его ключевым ресурсом для биомедицинских исследований.
Можно видеть, что экспрессия РНК происходит во всех органах, но максимальная экспрессия происходит в женских половых органах, в большей степени в маточных трубах, и в желудочно-кишечном тракте, а если точнее - в тонкой и двенадцатиперстной кишке. Касаемо белков можно сказать, что экспрессия белков почти также происходит во всех органах, за исключением глаза и проксимального отдела пищеварительного тракта. Максимальная экспрессия белков происходит в почках и мочевом пузыре, в органах женской (в основном в маточных трубах) и мужской половой системы (в основном в яичке).
Рис. 4. представляет собой гистограмму, на котором можно удобно проанализировать уровень экспрессии продуктов (белков) гена ABCD4. В основном это почки, яичко и маточные трубы.
Анализ генов, связанных с транспортом кобаламина, в базах данных GO и UniProt подтвердил их ключевую роль в биосинтезе кобаламина. База данных Human Protein Atlas (HPA) показала тканевую специфичность экспрессии (например, ABCD4 — максимальная активность в почках и мужских и женских половых органах (в основном в яичке и маточных трубах)). Данные GO выявили обогащение терминами, связанными с метаболизмом кобаламина, а UniProt предоставил детали о локализации и функциях белков. Вместе эти базы данных позволили системно охарактеризовать гены и их биологическую значимость.