Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2024

Задание для самостоятельной работы

Все скачанные и полученные файлы должны находиться в вашей директории ~/term4/signals и её поддиректориях.

1. Поиск сигнала

В файле /P/y24/term4/fragments.fasta лежат фрагменты генома кишечной палочки, часть которых содержит сигнал связывания одного из транскрипционных факторов.

Программой MEME (вариант "zoops") найдите мотивы, два раза, без учёта и с учётом комплементарных последовательностей. Заполните соответствующие пункты формы.

Указания. Cоздайте рабочую директорию, войдите в неё. Запустите meme -h. Найдите, как задать вариант работы, что входные последовательности взяты из ДНК, что надо анализировать обе цепи и как указать поддиректорию для результатов (поддиректории для двух вариантов должны быть разные!). Информационное содержание (relative entropy) мотива ищите в текстовой выдаче программы.

2. Поиск сигнала в геноме родственной бактерии

Поиском по базе NCBI Genome найдите какой-нибудь полностью собранный и аннотированный геном любого штамма выделенной вам бактерии. Скачайте геном и таблицу особенностей. Внесите в форму идентификатор выбранной сборки. Программой FIMO при параметрах по умолчанию найдите места, похожие на найденный в предыдущем пункте сигнал, в геноме (ищите тот мотив, что имеет более высокое информационное содержание). Внесите в форму общее число находок.

Указания. При поиске сначала укажите название бактерии, затем поставьте два фильтра: чтобы геном был аннотирован в RefSeq и чтобы он был полным. Пройдите по гиперссылке в колонке Assembly, а на открывшейся странице — по гиперссылке FTP. Программу fimo сначала запустите без параметров, чтобы увидеть help.

3. Описание положения самых достоверных находок

Пользуясь таблицей особенностей, внесите в форму информацию о положении трёх находок с лучшими p-value: если находка в пределах гена, то какого, если между генами, то какими

2024/4/task_Apr24 (последним исправлял пользователь sas 2026-04-24 08:17:04)