Сигналы и мотивы. Поиск сигналов de novo.

Выбрала геном Mycobacterium tuberculosis. Скачала файлы с ДНК в формате fasta и аннотациями в формате gff и, воспользовавшись сервисом Operon-mapper, сформировала список оперонов. 100 нуклеотидов перед началом каждого оперона определились как промоторная зона. Далее использовала тот же скрипт, что и в предыдущем практикуме: для обучения, тестирования и негативного контроля.

MEME

Три мотива достаточно надежны, судя по их значениям e-value. Одна из последовательностей имет высокий GC-состав, что делает находку малозначимой. Решила далее работать с 3 мотивом.

Рис 1. Лого мотива 1

Рис 2. Лого мотива 2

Рис 3. Лого мотива 3

FIMO

Искала мотив в положительном и отрицательном контролях с помощью следующих команд:

fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt promotors.fasta fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt negative.fasta

Положительный контроль показал 80 находок, отрицательный- 4 находки.