Практикум 6.

Данный практикум я выполняла с испоользованием списка ID генов человека. Всего в списке 127 ID. Для начала я провела анализ обогощения терминами, чтобы определить, какие биологические процессы, молекулярные функции или клеточные компоненты могут быть значимыми для установления связи между предложенными генами.

1. Обогощение терминами с помощью GO.

База данных Gene Ontology (GO) предоставляет информацию о функциях генов и их продуктов. Она состоит из трех основных 'категорий': Molecular Function (MF), Cellular Component (CC), and Biological Process (BP). PANTHER 'разделяет' белки в эволюционные семейства и аннотирует их с помощью GO-терминов.

Я провела анализ обогащения теорминами с помощью PANTHER. Для этого использовала тест Фишера и поправку Бонферрони на множественную проверку гипотез. На рисунке 1 параметры запуска для одного из запросов. Для двух других запросов менялись значения Annotation Data Set.

Рис. 1 Параметры для проведения обогощения терминами GO.

Табличную выдачу находок можно посмотреть: biological process, cellular component, molecular function.

GO biological process

Рис. 2Значимые находки GO biological process

Судя по значимым находкам в этой категории белки генов из набора преимущественно участвуют в метаболизме:

  • катаболический процесс соединения серы
  • катаболический процесс производных углеводов
  • метаболизм макромолекул
  • метаболизм гликопротеина
  • GO molecular function

    Рис. 3Значимые находки GO molecular function

    Видно, что белки преимущественно относятся к трансферазам. Ферменты этого класса катализируют перенос группы (метал-, гликозил-, ацил-, фосфорсодержащей) от одного компонента (чаще всего донора) к другому (акцептору).

    GO cellular component

    Рис. 4Значимые находки GO cellular component

    Здесь прослеживается принадлежность генов из списка к метаболизму в клетке, т к мы видим, что белки находятся в лизосомах, вакуолях, цитоплазме.

    2. Human Protein Atlas.

    Human Protein Atlas (HPA) — шведская программа, запущенная в 2003 году с целью создания карты всех человеческих белков в клетках , тканях и органах. Она предоставляет данные об их распределении в нормальных и опухолевых тканях, субклеточной локализации, а также прогностической значимости для различных заболеваний.

    Для анализа я выбрала ген GLCE

    Общая информация про ген GLCE и белках, кодируемых этим геном, выданная HPA

  • Gene name: GLCE
  • Gene description: Glucuronic acid epimerase
  • Protein class: Enzymes, Metabolic proteins, Plasma proteins
  • Predicted location: Intracellular
  • Number of transcriptsi: 2
  • Функция: Преобразует остатки D-глюкуроновой кислоты, прилегающие к остаткам N-сульфатного сахара, в остатки L-идуроновой кислоты, как в созревающих цепях гепарансульфата (HS), так и в цепях гепарина. Это важно для дальнейших модификаций, которые определяют специфичность взаимодействий между этими гликозаминогликанами и белками.

    Рис. 5Локализация экспрессии гена GLCE

    Ген экспрессируется везде, но больше всего РНК в мозгу

    Рис. 6Локализация экспрессии белков, кодируемых GLCE

    Продукты гена локализованы в разных органах примерно одинаково: мозг; легкие; печень и тд.

    Вывод: Белок кодируемый геном GLCE экспрессируется в большинстве тканей.