Практикум 6. Базы данных KEGG, GO и другие

Для выполнения данного практикума мне достался набор 57 генов, что не мало для анализа. Ну от того работа будет веселее (надо мыслить позитивно). Что ж, да начнётся приключение по БД.

Рисунок 1. Напутствие на прак

Метод пристального взгляда и догадок

В моём наборе очень много генов со схожими видами записи. Например: (Дисклеймер: маленькие латинские буквы n,k,l,m - переменные для цифр и букв, основной упор делаем на заглавные буквы)

В общем, много где фигурирует слово гепарансульфат, а это явно не спроста. Так что теперь начинаем ползать по базам и делать более значимые выводы.

Рисунок 2. Продолжение следует

GO + PANTHER

Для начала необходимо понять, что может объединять данные гены функционально. Для этого воспользуемся базой данных GO. База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. В GO существуют аннотации – утверждения, связывающие конкретный генный продукт с конкретным онтологическим термином, основанные на фактических данных. Помимо этого в GO существуют 3 группы терминов:

Переходим на сайт базы данных и в специальное окно GO Enrichment Analysis вставляем список ID генов, после чего нажимаем Launch, после этого нас перекидывает на сайт PANTHER (и снова время мема).

Рисунок 3. Как мне представляется эмблема сайта PANTHER