Практикум №11

2

Let's GO делать практикумы!

Для выполнения задания использовался список генов. Для начала я решила проанализировать его в базе данных GO, которая представляет собой граф биологических терминов, соединенных различными отношениями. С помощью нее можно узнать функции генов из моего списка. На вход были поданы ID белков и организм Homo sapiens. По данным видно, что гены чаще всего экспрессируют белки, которые участвуют в метаболических и биосинтетических процессах (рис. 1).

1

Рис. 1 Результат обогащения по данному набору генов в базе данных GO

STRING

Далее анализ был проведен с помощью базы данных STRING. Здесь уже получились более интересные картинки (один рис.2 чего стоит - загляденье). Получился граф, в который входят почти все белки, кроме CEMP1, CHI3L1, MANSC1.

CEMP1 - может играть роль в развитии периодонта (что-то про зубы); CHI3L1 - может играть роль в ремоделировании тканей и способности клеток реагировать на изменения в окружающей среде и справляться с ними (что-то про хитин); MANSC1 - на самом сайте про него ничего не написано, загуглив, я нашла про него информацию о том, что с ним связаны заболевания - синдром Темтами и аутосомно-доминантное нарушение интеллекта. В общем, эти белки не имеют особого отношения к метаболизму, как все остальные, что было выяснено выше с помощью GO.

2

Рис. 2 Граф String

В разделе Analysis можно найти информацию о участии в биологических процессах и молекулярные функции (рис.3). Многие белки участвуют в процессах биосинтеза глюкозамина. Также большинство белков имеют маннокиназную, фруктокиназную, глюкокиназную активности.

3

Рис. 3 Части таблиц с биологическими процессами и молекулярными функциями

Посмотрим появление белков в разных организмов (рис.4). Логично, что особенно часто все белки встречаются у Opisthokonta. Интересно, что есть несколько белков, которые встречаются во всех кладах, например, GALE, UXS1, TGDS. А вот MANSC1 встречается всего в двух кладах (помимо Opisthokonta), что это за белок я уже упоминала выше.

4

Рис. 4 Распространенность белков

Далее была рассмотрена связь между GNPNAT1 и NAGK на основе наблюдаемой коэкспрессии гомологов у других видов (Caenorhabditis elegans). В C. elegans таких генов больше.

5

Рис. 5 Схема совместной экспресии

REACTOME

Так как мне мало красивых картинок, список генов был закинут в Reactome просто для поднятия настроения.

6

6

Рис. 6 и 7 Выдача Reactome