Данный практикум я выполняла с испоользованием списка ID генов человека. Всего в списке 127 ID. Для начала я провела анализ обогощения терминами, чтобы определить, какие биологические процессы, молекулярные функции или клеточные компоненты могут быть значимыми для установления связи между предложенными генами.
База данных Gene Ontology (GO) предоставляет информацию о функциях генов и их продуктов. Она состоит из трех основных 'категорий': Molecular Function (MF), Cellular Component (CC), and Biological Process (BP). PANTHER 'разделяет' белки в эволюционные семейства и аннотирует их с помощью GO-терминов.
Я провела анализ обогащения теорминами с помощью PANTHER. Для этого использовала тест Фишера и поправку Бонферрони на множественную проверку гипотез. На рисунке 1 параметры запуска для одного из запросов. Для двух других запросов менялись значения Annotation Data Set.
Табличную выдачу находок можно посмотреть: biological process, cellular component, molecular function.
Судя по значимым находкам в этой категории белки генов из набора преимущественно участвуют в метаболизме:
Видно, что белки преимущественно относятся к трансферазам. Ферменты этого класса катализируют перенос группы (метал-, гликозил-, ацил-, фосфорсодержащей) от одного компонента (чаще всего донора) к другому (акцептору).
Здесь прослеживается принадлежность генов из списка к метаболизму в клетке, т к мы видим, что белки находятся в лизосомах, вакуолях, цитоплазме.
Human Protein Atlas (HPA) — шведская программа, запущенная в 2003 году с целью создания карты всех человеческих белков в клетках , тканях и органах. Она предоставляет данные об их распределении в нормальных и опухолевых тканях, субклеточной локализации, а также прогностической значимости для различных заболеваний.
Для анализа я выбрала ген GLCE
Общая информация про ген GLCE и белках, кодируемых этим геном, выданная HPA
Функция: Преобразует остатки D-глюкуроновой кислоты, прилегающие к остаткам N-сульфатного сахара, в остатки L-идуроновой кислоты, как в созревающих цепях гепарансульфата (HS), так и в цепях гепарина. Это важно для дальнейших модификаций, которые определяют специфичность взаимодействий между этими гликозаминогликанами и белками.
Ген экспрессируется везде, но больше всего РНК в мозгу
Продукты гена локализованы в разных органах примерно одинаково: мозг; легкие; печень и тд.
Вывод: Белок кодируемый геном GLCE экспрессируется в большинстве тканей.