Учебная страница курса биоинформатики,
год поступления 2012
Домашнее задание по поиску сигналов
Срок выполнения (окончательный!) – утро понедельника 13 апреля 2015
- Найти базу данных KEGG.
Найти указанный участок метаболического пути, см. варианты.
- Выделить upstream (–200) области для генов из этого участка пути. При этом хорошо бы учесть оперонную структуру. Возможности:
Скачать геном E.coli и написать скрипт на Python или Lua.
- Выделить соответствующие области средствами KEGG.
Прогнать MEME для поиска мотива (найти сервер или использовать ememe, установленный на kodomo).
- Найти ортологов одного из генов в гамма-протеобактериях. Найти сигнал с использованием этих данных. Не используйте слишком близкие геномы!
- Повторить пункты 4--5 с использованием вместо MEME одной из реализаций Gibbs-sampler (реализацию самостоятельно найти в Сети).
- Подготовить отчет:
- Список генов
- Скрипт, если использовался для разбора генома.
- Районы поиска сигнала
- Найденные мотивы
- Сравнение мотивов, найденных разными способами
Отчёт выложить в виде файла в свою директорию на kodomo в поддиректорию term6/motifs не позднее 10:00 13 апреля.