Данный практикум я выполняла с испоользованием списка ID генов человека. Всего в списке 127 ID. Для начала я провела анализ обогощения терминами, чтобы определить, какие биологические процессы, молекулярные функции или клеточные компоненты могут быть значимыми для установления связи между предложенными генами.
База данных Gene Ontology (GO) предоставляет информацию о функциях генов и их продуктов. Она состоит из трех основных 'категорий': Molecular Function (MF), Cellular Component (CC), and Biological Process (BP). PANTHER 'разделяет' белки в эволюционные семейства и аннотирует их с помощью GO-терминов.
Я провела анализ обогащения теорминами с помощью PANTHER. Для этого использовала тест Фишера и поправку Бонферрони на множественную проверку гипотез. На рисунке 1 параметры запуска для одного из запросов. Для двух других запросов менялись значения Annotation Data Set.
Табличную выдачу находок можно посмотреть: biological process, cellular component, molecular function.
Судя по значимым находкам в этой категории белки генов из набора преимущественно участвуют в метаболизме:
Видно, что белки преимущественно относятся к трансферазам. Ферменты этого класса катализируют перенос группы (метал-, гликозил-, ацил-, фосфорсодержащей) от одного компонента (чаще всего донора) к другому (акцептору).
Здесь прослеживается принадлежность генов из списка к метаболизму в клетке, т к мы видим, что белки находятся в лизосомах, вакуолях, цитоплазме.
Human Protein Atlas (HPA) — шведская программа, запущенная в 2003 году с целью создания карты всех человеческих белков в клетках , тканях и органах. Она предоставляет данные об их распределении в нормальных и опухолевых тканях, субклеточной локализации, а также прогностической значимости для различных заболеваний.
Для анализа я выбрала ген GLCE
Общая информация про ген GLCE и белках, кодируемых этим геном, выданная HPA
Функция: Преобразует остатки D-глюкуроновой кислоты, прилегающие к остаткам N-сульфатного сахара, в остатки L-идуроновой кислоты, как в созревающих цепях гепарансульфата (HS), так и в цепях гепарина. Это важно для дальнейших модификаций, которые определяют специфичность взаимодействий между этими гликозаминогликанами и белками.
Ген экспрессируется везде, но больше всего РНК в мозгу
Продукты гена локализованы в разных органах примерно одинаково: мозг; легкие; печень и тд.
Общий вывод
Проведенный анализ обогащения терминами Gene Ontology (GO) для списка из 127 генов человека выявил значимые ассоциации с метаболическими процессами, в частности:
Биологические процессы (BP):Катаболизм соединений серы и углеводов, метаболизм макромолекул и гликопротеинов.
Молекулярные функции (MF):Преобладание трансферазной активности, что указывает на участие генов в переносе химических групп.
Клеточные компоненты (CC):Локализация белков в лизосомах, вакуолях и цитоплазме, подтверждающая их роль в внутриклеточном метаболизме.
Дополнительное исследование гена GLCE (Glucuronic acid epimerase) с использованием Human Protein Atlas показало широкую тканевую экспрессию, особенно высокую в мозге. Также из описания я узнала о функциональной значимости белка в модификации гепарансульфата и гепарина, что критично для их взаимодействия с другими белками.
Заключение: Гены из анализируемого списка преимущественно вовлечены в метаболические пути, а их продукты локализованы в ключевых компартментах клетки. Пример GLCE иллюстрирует связь между ферментативной активностью (эпимеризация гликозаминогликанов) и биологической значимостью для межклеточных взаимодействий. Полученные данные могут служить основой для дальнейшего изучения роли этих генов в заболеваниях, ассоциированных с нарушениями метаболизма.