Для работы был взят Bacillus cereus NC7401. С помощью Operon-mapper нашел координаты оперонов бактерий. С помощью скрипта осуществил поиск 100 оперонов, содержащих исследуемые гены и записывал 100 промоторных областей этих оперонов в отедльный файл. Кроме того получаем файл тестовой выборки.
housekeeping.fasta, promoters.fasta negativecont.fastaПоиск мотивов осуществлялся на кодомо с помощью команды ниже:
meme house_keeping_promoters.txt -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50
В результате были получены 3 мотива, представленные ниже:
Для дальнейшей работы был взят 1 мотив как самый подходящий.
Поиск проводил по мотиву aaaGGAGG в тестовой выборке и выборке негативного контроля. Для этого на вход локальной версии fimo были переданы сама последовательность мотива, файл тестовой выборки, файл негативного контроля и выдача meme:
fimo --norc -motif AAAGGAGG -thresh 0.001 meme_out/meme.txt all_promoters.fasta
fimo --norc -motif AAAGGAGG -thresh 0.001 meme_out/meme.txt negative_cont.fasta
Результаты поиска:
Файлы: fimo_p.tsv и fimo_n.tsvВ 1065 последовательностях тестовой выборки обнаружился сигнал сигнал. И только 314 сигналов было найдено в выборке негативного контроля.