Для анализа мне был предоствлен список генов человека, состоящий из 50 генов(ссылка на список генов - link)
Задача состоит в том, чтобы определить как гены из этого набора связаны между собой.
Для анализа были выбраны следующие базы данных/сервисы: GO, Reactome. Также один из генов был проанализирован с помощью сервиса Human Protein Atlas.
База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. Термин GO (GO term) – узел графа – может иметь любое количество связей с любыми другими узлами. Отношения между узлами – ребра графа бывают разного типа: "is a", "part of", "regulates".
В GO термины разделены по 3 группам:
1.Молекулярная функция (Molecular Function)-описывается биохимическая активность гена/белка
2.Биологический процесс (Biological Process)-описываются более крупные процессы, в которых участвует ген/белок.
3.Клеточный компонент (Cellular Component)-указывается место в клетке, где действует ген/белок
Был проведен анализ обогащения (этим анализом мы хотим узнать обогащен ли наш список генами, связанными с определенным термином)
В качестве статистического теста я выбрала точный тест Фишера, в качестве поправки на множественное выравнивание - FDR.
В выдаче оказалось 20580 терминов.
Таблица с результатами доступна по ссылке - results
Оказалось, что самые достоверные находки так или иначе связаны с метаболизмом протеогликанов и гликопротеинов.
Reactome — это база данных, содержащая информацию о молекулярных путях, реакциях и биологических процессах. Одним из приемуществ этой базы данных является отличная визуализация.
Белки оказались разбросаны по большому количеству групп. Проведем анализ на основе уже имеющихся данных.
Протеогликаны — высокомолекулярные соединения, состоящие из белка (5–10%) и гликозаминогликанов (90–95%). Образуют основное вещество внеклеточного матрикса соединительной ткани. Поэтому у нас есть группа белков (11 белков), связанная с внеклеточным матриксом. Эти протеогликаны могут обеспечивать встречаемость в группах, связанных с биологией развития (развитие эпидермиса), гемостазом (поддержание структуры кровяных сосудов).
Гликопротеины — двухкомпонентные белки, в которых белковая (пептидная) часть молекулы ковалентно соединена с одной или несколькими группами гетероолигосахаридов. Являются важным структурным компонентом клеточных мембран животных и растительных организмов(поэтому список обогащен терминами, связанная с метаболизмом гликосфинголипидов).
Среди заболеваний встречаются мукополисахаридозы,а также заболевания связанные с метаболизмом глюкозаминогликаном
В искомом списке есть гены, связанные с синтезом жирорастворимых витаминов(синтез гликопротеинов зависит от витамина А (ретинола)), а также свяазнные с синтезом глюкозаминогликанов.
Это база данных, посвящённая изучению экспрессии и локализации белков в тканях, клетках и органах человека. С помощью этого ресурса можно определить распределение экспрессии белка в разных тканях, субклеточную локализацию, экспрессию в мозге, в разных типах рака и краткое описание известных функций.
Для анализа я выбрала ген HYAL3(Hyaluronidase 3). Ген расположен на 3 хромосоме, имеет 7 транскриптов.
Сервис позволяет проанализировать уровень экспресиии в разных тканях и органах. Максимальный уровень экспсресии - в костном мозге, семенники вторые по уровню экспрессии.
Белок этого гена является ферментом, имеет внеклеточную локализацию. Гиалуроновая кислота - ключевой компонент внеклеточного матрикса костного мозга, создающий "каркас" для клеток. Гиалуранидаза расщепляет гиалуроновую кислоту, позволяя созревшим клеткам мигрировать. А также фермент способствует проникновению сперматозоидов в слой кумулятивных клеток, окружающих яйцеклетку, за счет расщепления гиалуроновой кислоты. Участвует в индукции акросомной реакции в сперматозоидах.
Также удалось найти, что данный белок взаимодействует с двумя другими - CAMK2A(Calcium/calmodulin dependent protein kinase II alpha) и DAB1(DAB adaptor protein 1)
В качестве вывода можно предположить, что гены из данного списка связаны с метаболизмом протеогликанов и гликопротеинов, поэтому задействованы в множестве разных процессов в организме человека (составляют соединительную ткань, являются струкутрным компоненотом клеточных мембран, составляют межклеточные контакты и тд)