В данном практикуме анализировался список из 20 ID генов человека . Для работы я выбрал базы данных GO, STRING и Human Protein Atlas
Gene Ontology (GO) — крупная база данных, хранящая информацию о функции генов, связывая их с конкретными онтологическими терминами:
С помощью GO был проведен анализ обогащения терминами с использованиям теста Фишера и поправки Бонферрони. Полученная таблица
Как видно из таблицы, гены связаны с метаболизмом протеогликанов, гликозаминогликаннов и, в первую очередь, с синтезом хондроитин сульфата.
STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) — биологическая база данных, содержащая информацию о известных и предсказанных взаимодействиях белков. С её помощью был получен граф белок-белковый взаимодействий на основе исследуемого списка ID.
Все белки образуют один кластер (согласно алгоритму MCL clustering), так как относятся к реактому биосинтеза хондроитин сульфата. На графе в стороне оказался белок CHST9 (carbohydrate sulfotransferase 9).Согласно UniProt он катализирует перенос сульфата в положение 4 нередуцирующих остатков N-ацетилгалактозамина.
Human Protein Atlas — проект, цель которого визуализировать распределение белков в клетках, тканях и органах человека. С помощью данного сервиса я исследовал ген CHST9.
Как видно, экспрессия гена CHST9 идет во многих тканях человека, особенно сильно в проксимльной части пищеварительной системы.
В исследуемом списке ID находятся гены белков, отвечающих за синтез хондроитин сульфата. Один из этих генов, CHST9, эксперссируется во многих тканях организма человека.