Практикумы 7. MEME & FIMO

1. Подготовка данных

Для работы в этом практикуме я выбрала геном Mycobacterium tuberculosis H37Rv. Используя файлы с последовательностью и анотацией и сервиса Operon-mapper был получен файл с оперонами. Используя скрипт Муравьева Георгия, были получены файлы обучения, тестирования (совокупность промоторов генов моей бактерии) и негативного контроля (совокупность участков ДНК, не пересекающихся с промоторами).

2. MEME

Было найдено 3 мотива, которые можно считать достаточно достоверными, т.к. они имеют высокий e-value. Для дальнейшей работы был выбран третий мотив.

Рисунок 1. LOGO мотива 1
Рисунок 2. LOGO мотива 2
Рисунок 3. LOGO мотива 3
3. Поиск сигнала с помощью FIMO

Для поиска мотива в положительном и отрицательном контролях были использованы команды:

fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt promotors.fasta

fimo --norc -motif TRWCWSWAGRCAKMAAGACHMGTTWTAWA -thresh 0.001 meme_out/meme.txt negative.fasta

В положительном контроле было найдено 80 находок, в отрицательном - 4 находки.