Для работы в этом практикуме я выбрала геном Mycobacterium tuberculosis H37Rv. Используя файлы с последовательностью и анотацией и сервиса Operon-mapper был получен файл с оперонами. Используя скрипт Муравьева Георгия, были получены файлы обучения, тестирования (совокупность промоторов генов моей бактерии) и
негативного контроля (совокупность участков ДНК, не пересекающихся с промоторами).
Было найдено 3 мотива, которые можно считать достаточно достоверными, т.к. они имеют высокий e-value. Для дальнейшей работы был выбран третий мотив.
Для поиска мотива в положительном и отрицательном контролях были использованы команды:
fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt promotors.fasta
fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt negative.fasta
В положительном контроле было найдено 80 находок, в отрицательном - 4 находки.