Для выполнения практикума был выбран геном Thermogutta terrifontis штамм R1 (fasta-файл). Далее с помощью сервиса Operon-mapper был получен файл с предсказанными оперонами. Промотором считается область 100 нуклеотидов перед началом оперона. С помощью скрипта были получены 3 файла: обучения (гены домашнего хозяйства), тестирования и негативного контроля.
Далее был использован локальный MEME:
meme ./pr7/hk.fasta -dna -nmotifs 3 -minw 6(output-файл)
Было найдено три мотива: LOGO-1 (рис. 1, E-value = 8.3e+000), LOGO-2 (рис.2, E-value = 1.8e+000), LOGO-3 (рис.3, E-value = 1.4e+002). У всех трех мотивов очень высокий по значению E-Value. Для дальнейшей работы был выбран второй мотив (из-за минимального E-Value).
Для поиска выбранного мотива в положительном и негативном контроле был использован FIMO:
fimo --norc -motif ACNYWWCCACNCYBWCAAGSYWSTATHATBTYNKCYCCMM -thresh 0.001 ./pr7/meme_out/meme.txt ./pr7/promotors.fasta
fimo --norc -motif ACNYWWCCACNCYBWCAAGSYWSTATHATBTYNKCYCCMM -thresh 0.001 ./pr7/meme_out/meme.txt ./pr7/negative.fasta
Получены следующие таблицы: positive и negative. Этот мотив был найден в 220 промоторах среди всех и в 8 находках в негативном контроле.