Задание для самостоятельной работы
Все скачанные и полученные файлы должны находиться в вашей директории ~/term4/signals и её поддиректориях.
1. Поиск сигнала
В файле /P/y24/term4/fragments.fasta лежат фрагменты генома кишечной палочки, часть которых содержит сигнал связывания одного из транскрипционных факторов.
Программой MEME (вариант "zoops") найдите мотивы, два раза, без учёта и с учётом комплементарных последовательностей. Заполните соответствующие пункты формы.
Указания. Cоздайте рабочую директорию, войдите в неё. Запустите meme -h. Найдите, как задать вариант работы, что входные последовательности взяты из ДНК, что надо анализировать обе цепи и как указать поддиректорию для результатов (поддиректории для двух вариантов должны быть разные!). Информационное содержание (relative entropy) мотива ищите в текстовой выдаче программы.
2. Поиск сигнала в геноме родственной бактерии
Поиском по базе NCBI Genome найдите какой-нибудь полностью собранный и аннотированный геном любого штамма выделенной вам бактерии. Скачайте геном и таблицу особенностей. Внесите в форму идентификатор выбранной сборки. Программой FIMO при параметрах по умолчанию найдите места, похожие на найденный в предыдущем пункте сигнал, в геноме (ищите тот мотив, что имеет более высокое информационное содержание). Внесите в форму общее число находок.
Указания. При поиске сначала укажите название бактерии, затем поставьте два фильтра: чтобы геном был аннотирован в RefSeq и чтобы он был полным. Пройдите по гиперссылке в колонке Assembly, а на открывшейся странице — по гиперссылке FTP. Программу fimo сначала запустите без параметров, чтобы увидеть help.
3. Описание положения самых достоверных находок
Пользуясь таблицей особенностей, внесите в форму информацию о положении трёх находок с лучшими p-value: если находка в пределах гена, то какого, если между генами, то какими

2025
2023
2022
2021
2020
2019
2018
2017