Выбрала геном Mycobacterium tuberculosis. Скачала файлы с ДНК в формате fasta и аннотациями в формате gff и, воспользовавшись сервисом Operon-mapper, сформировала список оперонов. 100 нуклеотидов перед началом каждого оперона определились как промоторная зона. Далее использовала тот же скрипт, что и в предыдущем практикуме: для обучения, тестирования и негативного контроля.
Три мотива достаточно надежны, судя по их значениям e-value. Одна из последовательностей имет высокий GC-состав, что делает находку малозначимой. Решила далее работать с 3 мотивом.
Рис 1. Лого мотива 1
Рис 2. Лого мотива 2
Рис 3. Лого мотива 3
Искала мотив в положительном и отрицательном контролях с помощью следующих команд:
Положительный контроль показал 80 находок, отрицательный- 4 находки.