Практикум 7. Базы данных KEGG и GO:

Список ID

Попробуем воспользоваться GO(Gene Ontology) для первого анализа:
Входные данные: Ген AADAT.

n1.png
Попробуем найти информацию по данному гену
База данных Gene Ontology может быть использована для поиска известной информации по генам
n2.png
Сузим поиск по ассоциациям терминов GO с генами и их продуктам (Genes and gene products)
n3.png
GO выдал нам информацию по точному написанию ID для каждой позиции, название, организм, тип позиции, семейство, источник информации и известные синонимические обозначения данной позиции из списка.

Польза данного способа поиска информации по гену очевидна. Например, зная ID гена мыши мы можем найти что он синтезирует (ещё перед этим мы можем применить фильтр по организму, чтобы показало только мышь), узнать Uniprot ID или ID из другой базы данных и отправиться изучать данный ген более подробно.

Попробуем ознакомиться со STRING

Входные данные: белок с PDB ID 1Y2S (Простите за самодеятельность, но очень интересно посмотреть, что STRING даст по поводу прионного белка, который мы изучаем в лабе)

n4.png
Запрос
n5.png
Граф взаимодействий
n6.png
Видно, что STRING принимает PDB ID, он поменял 1Y2S на ID PRNP. Показывает с какими белками он взаимодействует или может взаимодействовать. Показал организм и известна ли структура белков из графа

К сожалению STRING не показал, взаимодействует ли прион с интересующим меня белком, подтверждая то, что этим пока никто ещё не занимался

Вернёмся в систему GO и попробуем сделать для нашего списка ID анализ обогащения терминами по биологическим процессам:

n7.png
Запрос
n8.png
Получили данную таблицу, отсортируем её по проценту обогащения (я так понимаю это смысл Fold Enrichment)
На картинке лишь кусок таблицы: вот полная таблица

У нас есть довольно много строчек с обогащением >100. Можно даже прийти к выводу, что довольно крупная часть выборки представлена генами, занимающимися индол-содержащими метаболитными процессами (15 генов из выборки имеют данный термин из 23 возможных генов с таким термином из референсного генома). Всего в выборке у нас 42 ID

Назад