Практикум 6. Базы данных KEGG, GO и другие

Для анализа мне был предоствлен список генов человека, состоящий из 50 генов(ссылка на список генов - link)

Задача состоит в том, чтобы определить как гены из этого набора связаны между собой.

Для анализа были выбраны следующие базы данных/сервисы: GO, Reactome. Также один из генов был проанализирован с помощью сервиса Human Protein Atlas.

1. База данных GO

База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. Термин GO (GO term) – узел графа – может иметь любое количество связей с любыми другими узлами. Отношения между узлами – ребра графа бывают разного типа: "is a", "part of", "regulates".

В GO термины разделены по 3 группам:

1.Молекулярная функция (Molecular Function)-описывается биохимическая активность гена/белка

2.Биологический процесс (Biological Process)-описываются более крупные процессы, в которых участвует ген/белок.

3.Клеточный компонент (Cellular Component)-указывается место в клетке, где действует ген/белок

Был проведен анализ обогащения (этим анализом мы хотим узнать обогащен ли наш список генами, связанными с определенным термином)

В качестве статистического теста я выбрала точный тест Фишера, в качестве поправки на множественное выравнивание - FDR.

Рис 1. Параметры для анализа обогащения.

В выдаче оказалось 20580 терминов.

Таблица с результатами доступна по ссылке - results

Оказалось, что самые достоверные находки так или иначе связаны с метаболизмом протеогликанов и гликопротеинов.

2. Reactome

Reactome — это база данных, содержащая информацию о молекулярных путях, реакциях и биологических процессах. Одним из приемуществ этой базы данных является отличная визуализация.

Белки оказались разбросаны по большому количеству групп. Проведем анализ на основе уже имеющихся данных.

Рис 2. Диаграмма функций данных белков.

Протеогликаны — высокомолекулярные соединения, состоящие из белка (5–10%) и гликозаминогликанов (90–95%). Образуют основное вещество внеклеточного матрикса соединительной ткани. Поэтому у нас есть группа белков (11 белков), связанная с внеклеточным матриксом. Эти протеогликаны могут обеспечивать встречаемость в группах, связанных с биологией развития (развитие эпидермиса), гемостазом (поддержание структуры кровяных сосудов).

Рис 3. Организация внеклеточного матрикса

Гликопротеины — двухкомпонентные белки, в которых белковая (пептидная) часть молекулы ковалентно соединена с одной или несколькими группами гетероолигосахаридов. Являются важным структурным компонентом клеточных мембран животных и растительных организмов(поэтому список обогащен терминами, связанная с метаболизмом гликосфинголипидов).

Рис 4.Метаболизм гликосфинголипидов

Среди заболеваний встречаются мукополисахаридозы,а также заболевания связанные с метаболизмом глюкозаминогликаном

Рис 5. Заболевания, связанные с метаболизмом глюкозаминогликана

В искомом списке есть гены, связанные с синтезом жирорастворимых витаминов(синтез гликопротеинов зависит от витамина А (ретинола)), а также свяазнные с синтезом глюкозаминогликанов.

Рис 6,7. Метаболизм

3. Human Protein Atlas

Это база данных, посвящённая изучению экспрессии и локализации белков в тканях, клетках и органах человека. С помощью этого ресурса можно определить распределение экспрессии белка в разных тканях, субклеточную локализацию, экспрессию в мозге, в разных типах рака и краткое описание известных функций.

Для анализа я выбрала ген HYAL3(Hyaluronidase 3). Ген расположен на 3 хромосоме, имеет 7 транскриптов.

Сервис позволяет проанализировать уровень экспресиии в разных тканях и органах. Максимальный уровень экспсресии - в костном мозге, семенники вторые по уровню экспрессии.

Рис 6. Уровень экспресии гена HYAL3 в разных органах.

Белок этого гена является ферментом, имеет внеклеточную локализацию. Гиалуроновая кислота - ключевой компонент внеклеточного матрикса костного мозга, создающий "каркас" для клеток. Гиалуранидаза расщепляет гиалуроновую кислоту, позволяя созревшим клеткам мигрировать. А также фермент способствует проникновению сперматозоидов в слой кумулятивных клеток, окружающих яйцеклетку, за счет расщепления гиалуроновой кислоты. Участвует в индукции акросомной реакции в сперматозоидах.

Также удалось найти, что данный белок взаимодействует с двумя другими - CAMK2A(Calcium/calmodulin dependent protein kinase II alpha) и DAB1(DAB adaptor protein 1)

4. Вывод

В качестве вывода можно предположить, что гены из данного списка связаны с метаболизмом протеогликанов и гликопротеинов, поэтому задействованы в множестве разных процессов в организме человека (составляют соединительную ткань, являются струкутрным компоненотом клеточных мембран, составляют межклеточные контакты и тд)