Для выполнения данного практикума мне достался набор 57 генов, что не мало для анализа. Ну от того работа будет веселее (надо мыслить позитивно). Что ж, да начнётся приключение по БД.
Рисунок 1. Напутствие на прак
Метод пристального взгляда и догадок
В моём наборе очень много генов со схожими видами записи. Например: (Дисклеймер: маленькие латинские буквы n,k,l,m - переменные для цифр и букв, основной упор делаем на заглавные буквы)
HSnSTklm (это heparan sulfate-glucosamine n-sulfotransferase klm [ Homo sapiens (human) ]). Эти гены кодируют ферменты, участвующие в биосинтезе гепарансульфата и являющиеся ключевыми компонентами в создании множества различных тонких структур гепарансульфата, которые выполняют множество биологических функций.
GPCn (это glypican n [ Homo sapiens (human) ]). Протеогликаны гепарансульфата на поверхности клеток состоят из связанного с мембраной белкового ядра, замещенного различным числом цепей гепарансульфата. Представители семейства интегральных мембранных протеогликанов, связанных с глипиканом (GRIPS), содержат основной белок, прикрепленный к цитоплазматической мембране посредством гликозилфосфатидилинозитольной связи. Эти белки могут играть важную роль в контроле клеточного деления и регуляции роста.
NDSTn (это N-deacetylase and N-sulfotransferase n [ Homo sapiens (human) ]). Этот ген кодирует представителя семейства N-деацетилаз/N-сульфотрансфераз гепарансульфата/гепарина GlcNAc. Кодируемый фермент представляет собой трансмембранный белок II типа, находящийся в аппарате Гольджи. Кодируемый белок катализирует перенос сульфата из 3'-фосфоаденозин-5'-фосфосульфата в азот глюкозамина в гепарансульфате.
В общем, много где фигурирует слово гепарансульфат, а это явно не спроста. Так что теперь начинаем ползать по базам и делать более значимые выводы.
Рисунок 2. Продолжение следует
GO + PANTHER
Для начала необходимо понять, что может объединять данные гены функционально. Для этого воспользуемся базой данных GO. База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. В GO существуют аннотации – утверждения, связывающие конкретный генный продукт с конкретным онтологическим термином, основанные на фактических данных. Помимо этого в GO существуют 3 группы терминов:
Молекулярные функции (Molecular Function, MF) - специфическая функция генного продукта на молекулярном уровне, например каталитическая и транспортная активности.
Биологические процессы (Biological Process, BP) - комплексные явления, необходимые для жизнедеятельности организмов и происходящие благодаря последовательности молекулярных функций, например репарация ДНК, биосинтез цитозина.
Клеточные компоненты (Cellular Component, CC) - часть клетки или внеклеточного пространства, где продукт гена осуществляет свою функцию, например, митохондрия или плазматическая мембрана.
Переходим на сайт базы данных и в специальное окно GO Enrichment Analysis вставляем список ID генов, после чего нажимаем Launch, после этого нас перекидывает на сайт PANTHER (и снова время мема).
Рисунок 3. Как мне представляется эмблема сайта PANTHER