Для этого практикума был выбран геном Yersinia pestis (fasta-файл). Далее с помощью сервиса Operon-mapper был получен файл с предсказанными оперонами. Промотором считается область 100 нуклеотидов перед началом оперона. С помощью скрипта (был взят у Г.Муравьёва) были получены 3 файла: обучения (гены домашнего хозяйства), тестирования и негативного контроля.
Был использован локальный MEME:
meme ./housekeeping.fasta -dna -nmotifs 3 -minw 6
Всего было найдено три мотива: LOGO-1 (рис. 1, E-value = 1.5e-018), LOGO-2 (рис.2, E-value = 5.1e+000), LOGO-3 (рис.3, E-value = 2.1e+002). У всех трех мотивов не очень низкий по значению E-Value. Далее я выбрала первый мотив, так как он обладатель минимального E-Value).
Для поиска выбранного мотива в контролях был использован FIMO:
fimo --norc -motif ACAHTRVAAGAWGTYGCKNWWMWRGCNGGKGTWTCWWWWRYRACSGTNTC -thresh 0.001 ./meme_out/meme.txt ./meme_out/promotors.fasta
fimo --norc -motif ACAHTRVAAGAWGTYGCKNWWMWRGCNGGKGTWTCWWWWRYRACSGTNTC -thresh 0.001 ./meme_out/meme.txt ./meme_out/negative.fasta
В результате работы программы полусились следующие таблицы: positive и negative. Этот мотив был найден в 395 промоторах среди всех и в 19 находках в негативном контроле.