Практикум 6. Базы данных KEGG, GO и другие
Отчёт по этому заданию необходимо выложить на свой сайт со ссылкой со страницы семестра.
Мягкий дедлайн: 28 марта в 23:59. Жесткий дедлайн: 4 апреля в 23:59.
Каждому из Вас дан список ID генов человека [ Списки ID ] (каждый файл назван как Login.txt)). Вам необходимо проанализировать список ID с помощью как минимум двух баз данных/сервисов: GO, STRING, Human Protein Atlas, KEGG, Reactome, GeneCards, Panther. За дополнительные базы данных - бонусные баллы. Обязательно сделать хотя бы один анализ обогащения терминами! Если в качестве второй базы Вы выбираете GeneCards или Human Protein Atlas, то можно проанализировать только один ID из списка.
В качестве отчета оформите страницу на kodomo в виде СВЯЗНОГО ТЕКСТА с иллюстрациями. Не стесняйтесь проявлять свою фантазию и испытывать чувство юмора проверяющих, главное, чтобы это не мешало содержательной части отчета. В отчете должна быть представлена вся необходимая информация для понимания сути и цели исследования.
В отчете обязательно должно быть следующее:
- Кратко опишите входные данные (что они из себя представляют, сколько генов в списке, ссылка на список)
- База/сервис 1.
- Опишите анализ, который Вы задумали сделать.
- Краткие возможности базы данных/сервиса (что можно с его помощью сделать, на какие вопросы ответить, какую информацию получить, ...) и какие возможности выбранной базы данных вы использовали.
- Какие результаты Вы получили.
Проиллюстрируйте результаты, если возможности выбранного ресурса это позволяют. Подписи к иллюстрациям должны быть понятными без обращения к тексту Вашего отчета. В тексте должны быть ссылки на все рисунки.
- Все полученные результаты должны быть обсуждены - ЭТОТ пункт САМЫЙ главный, нам нужны ВАШИ мысли по поводу сделанного.
- База/сервис 2.
- План аналогичный.
Хотя бы в одном сервисе надо сделать анализ обогащения терминами. При описании результатов:
- Укажите параметры запуска анализа: метод, поправка на множественное тестирование.
- Приведите ссылку на таблицу с результатами, отсортированную по p-value с поправкой.
- Сколько терминов (GO terms, путей в KEGG или др.) оказалось в выдаче?
- В тексте опишите лучшие находки.
- Выводы
Бонусное задание: возьмите один ID и проанализируйте его средствами Genome Browser.
Оцениваться будет качество вашего отчета - связность и осмысленность обсуждения результатов, оформление.
Постарайтесь отнестись к заданию, как к возможности ознакомиться с разными ресурсами, проявить научную самостоятельность и узнать что-то новое и интересное.
Если у вас не получилось найти значимого обогащения терминами, напишите преподавателям. Но такое крайне маловероятно, потому что Вам даны списки генов, участвующие в определенных процессах (это подсказка).
При возникновении трудностей не стесняйтесь нам писать.