Практикум 6. Базы данных KEGG, GO и другие

Для выполнения данного практикума мне достался набор 57 генов, что не мало для анализа. Ну от того работа будет веселее (надо мыслить позитивно). Что ж, да начнётся приключение по БД.

Рисунок 1. Напутствие на прак

Метод пристального взгляда и догадок

В моём наборе очень много генов со схожими видами записи. Например: (Дисклеймер: маленькие латинские буквы n,k,l,m - переменные для цифр и букв, основной упор делаем на заглавные буквы)

В общем, много где фигурирует слово гепарансульфат, а это явно не спроста. Так что теперь начинаем ползать по базам и делать более значимые выводы.

Рисунок 2. Продолжение следует

GO + PANTHER

Для начала необходимо понять, что может объединять данные гены функционально. Для этого воспользуемся базой данных GO. База данных GO представляет собой граф биологических терминов, соединенных различными отношениями. В GO существуют аннотации – утверждения, связывающие конкретный генный продукт с конкретным онтологическим термином, основанные на фактических данных. Помимо этого в GO существуют 3 группы терминов:

Переходим на сайт базы данных и в специальное окно GO Enrichment Analysis вставляем список ID генов, после чего нажимаем Launch, после этого нас перекидывает на сайт PANTHER (и снова время мема).

Рисунок 3. Как мне представляется эмблема сайта PANTHER

Ниже представлены ссылки на таблицы для разных функций:

Скрины вставлять не хочу, лучше просто словами объясню выводы:

KEGG

Прежде, чем написать что-то умное, надо разбавить это ещё одним мемом (извините, но название БД само просит):

Рисунок 4. Мем-минутка

Теперь возвращаемся к серьёзным вещам.

Используем базу данных KEGG (Kyoto Encyclopedia of Genes and Genomes) — интегрированный ресурс, объединяющий 16 баз данных, структурированных в 4 категории:

KEGG предоставляет много удобных инструментов для работы со своими базами данных. Мне потребуется KEGG PATHWAY из категории системная информация, конкретно нас будет интересовать метаболический путь Glycosaminoglycan biosynthesis - heparan sulfate / heparin:

Рисунок 5. Изображение из KEGG PATHWAY

Честно говоря, я вот эти линии и черты (спасибо, что не чёрты) не совсем понимаю, но они точно имеют смысл (иначе бы умные японцы не стали бы их сюда загружать). Поэтому я хочу продолжить исследования и попробую использовать еще одну БД.

REACTOME

Решила попробовать REACTOME, потому что легендарные графы STRING я бы расшифровывала только при помощи карт таро.

В общем, для работы с REACTOME мне понадобились они:

Рисунок 6. Гадание на интерфейс онлайн бесплатно

После того, как я разобралась с интерфейсом, были получены следующие результаты (поскольку делать изображения в формате png для REACTOME сделалось труднозатратно, в этом формате только общее изображение, а всё остальное - принтскрины, надеюсь, что на сайте это не сильно шакально будет смотреться):

Рисунок 7. Общее изображение с Reacfoam
Рисунок 8. Метаболизм (в основном, метаболизм углеводов и их производных, а также метаболизм витаминов и кофакторов) + Заболевания (в основном, заболевания метаболизма и инфекционные заболевания) + Сенсорное восприятие (зрительная фототрансдукция)
Рисунок 9. Организация внеклеточного матрикса
Рисунок 10. Клеточные поверхностные взаимодействия в стенке сосуда
Рисунок 11. Регуляция транспорта ИПФР и поглощение СБИПФР

ВЫВОДЫ

Для начала (конца), пару слов про бд: GO + PANTHER самая информативная, жаль, что кроме пантеры больше картинок нет. Reactome удобно пользоваться, только тогда, когда поймал связь с космосом, хотя ответ дал проще всех (ну и вайбы Миэль Попс Жу-Жу-Жу) KEGG реально для японцев (слишком умно), ну либо для криптографов (мб поймут, что хотел сказать автор).

В итоге, я еще на этапе пристального взгляда примерно поняла, что к чему. И так, мой сет генов принимает участие преимущественно в следующих процессах:

Ну и на конец остался самый легендарный мем (мы начали ЗВ, значит ими и закончим):

Рисунок 12. Literally моё состояние