Для выполнения задания использовался список генов. Для начала я решила проанализировать его в базе данных GO, которая представляет собой граф биологических терминов, соединенных различными отношениями. С помощью нее можно узнать функции генов из моего списка. На вход были поданы ID белков и организм Homo sapiens. По данным видно, что гены чаще всего экспрессируют белки, которые участвуют в метаболических и биосинтетических процессах (рис. 1).
Рис. 1 Результат обогащения по данному набору генов в базе данных GO
Далее анализ был проведен с помощью базы данных STRING. Здесь уже получились более интересные картинки (один рис.2 чего стоит - загляденье). Получился граф, в который входят почти все белки, кроме CEMP1, CHI3L1, MANSC1.
CEMP1 - может играть роль в развитии периодонта (что-то про зубы); CHI3L1 - может играть роль в ремоделировании тканей и способности клеток реагировать на изменения в окружающей среде и справляться с ними (что-то про хитин); MANSC1 - на самом сайте про него ничего не написано, загуглив, я нашла про него информацию о том, что с ним связаны заболевания - синдром Темтами и аутосомно-доминантное нарушение интеллекта. В общем, эти белки не имеют особого отношения к метаболизму, как все остальные, что было выяснено выше с помощью GO.
Рис. 2 Граф String
В разделе Analysis можно найти информацию о участии в биологических процессах и молекулярные функции (рис.3). Многие белки участвуют в процессах биосинтеза глюкозамина. Также большинство белков имеют маннокиназную, фруктокиназную, глюкокиназную активности.
Рис. 3 Части таблиц с биологическими процессами и молекулярными функциями
Посмотрим появление белков в разных организмов (рис.4). Логично, что особенно часто все белки встречаются у Opisthokonta. Интересно, что есть несколько белков, которые встречаются во всех кладах, например, GALE, UXS1, TGDS. А вот MANSC1 встречается всего в двух кладах (помимо Opisthokonta), что это за белок я уже упоминала выше.
Рис. 4 Распространенность белков
Далее была рассмотрена связь между GNPNAT1 и NAGK на основе наблюдаемой коэкспрессии гомологов у других видов (Caenorhabditis elegans). В C. elegans таких генов больше.
Рис. 5 Схема совместной экспресии
Так как мне мало красивых картинок, список генов был закинут в Reactome просто для поднятия настроения.
Рис. 6 и 7 Выдача Reactome