Для поиска оперонов в геноме я выбрала штамм OT19 бактерии Croceicoccus marinus. Для поиска оперонов использовался Operon-mapper, на вход которому был подан fasta file c геномом выбранной бактерии. На выходе был получен файл со списком всех найденных оперонов.
Для дальнейшей подготовки данных был использован скрипт Муравьёва Георгия. Промотором было решено считать 100 нуклеотидов перед опероном. Получили на выход:
После выполнения команды
meme housekeeping.fasta -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50 -maxsites 50
был получен файл, в котором находятся 3 мотива:
Первые два мотива проходят порог значимости, равный 0.05 (соответствующее E-value меньше 0.05). Для работы был выбран первый мотив из-за самого низкого E-value и GC-состава (в первом мотиве 20% GC, во втором - 43%)
Запуск FIMO осуществлялся по следующим командам:
fimo --norc -motif CGSSRCHWKKAGAGDCCAVBCSRTWYBWGAARRMTDSSTWVMRAVGRTBD -thresh 0.001 ./meme_out/meme.txt promotors.fasta
fimo --norc -motif CGSSRCHWKKAGAGDCCAVBCSRTWYBWGAARRMTDSSTWVMRAVGRTBD -thresh 0.001 ./meme_out/meme.txt negative.fasta
В резьтате были получены promotors_fimo.tsv и negative_fimo.tsv соответственно. При пороге в 0.001 получилось 202 находки в промоторах и 7 находок в негативном контроле.