Отчет по практикуму 7
Поиск сигнала посадки сигма-фактора в промоторах генов Bacillus subtillis
Отбор последовательностей
Для поиска сайта посадки сигма-фактора был выбран геном Bacillus subtillis, взятый с сайта NCBI. При помощи онлайн-сервиса Operonmapper на основе генома и хромосомной таблицы в геноме были предсказаны опероны. По этим данным в геноме были найдены промоторы. По ключевым словам в аннотации были определены промоторы генов домашнего хозяйства: транскрипционных факторов, CDS, ассоциированных с трансляцией и транскрипцией, РНК- и ДНК-полимераз, CDS ассоциированные с системой цитохрома P450, АТФаз. 40 случайных промоторов генов домашнего хозяйства были затем выбраны для составления материала обучения.
Запуск MEME
Для запуска MEME была использована следующая команда:
meme Train.fasta -dna -nmotifs 3 -minw 6
Для поиска только первого мотива, использованного далее
meme Train.fasta -dna -nmotifs 1 -minw 6 -o ./meme_out_2
Программой MEME в материале обучения было обнаружено 3 мотива, лого которых представлено ниже (рис. 1 -3). Далее было решено работать с первым мотивом, поскольку он имел наибольшую длину и хорошее значение E-value (2.1*10^-7). Полная выдача MEME доступна по ссылке.
Запуск FIMO
В качестве материала для тестирования были взяты промоторы всех оперонов. Для запуска FIMO была использована следующая команда:
fimo -thresh 0.001 meme_out_2/meme.txt Test.fasta
Выдача программы FIMO доступна по ссылке. Пороговое значение p-value в аргументе -thresh было определено опытным путем таким образом, чтобы для большинства находок был найден только один мотив в последовательности. Поиск при помощи FIMO обнаружил 1593 находок в 1069 промоторах.
В качестве негативного контроля были взяты последовательности вне оперонов, той же длины, что и промоторы, в том же количестве, что и материал для тестирования. Для запуска FIMO была использована следующая команда:
fimo -thresh 0.001 meme_out_2/meme.txt Negative.fasta
Выдача программы FIMO доступна по ссылке. Поиск при помощи FIMO обнаружил 466 находок в 400 непромоторных участках. Это намного меньше, чем было найдено в материале для тестирования.