Подготовка файлов

Для работы был выбран референсный геном Campylobacter coli (GCF_009730395.1_ASM973039v1) – бактерии, с которой я работала в первом семестре. Геном скачала NCBI. Далее, при помощи сервиса Operon-mapper я получила список оперонов (можно найти тут).

Далее этот список вместе с геномом бактерии я подала на вход скрипту, который был написан Георгием Муравьёвым. Я получила три выборки: обучающую (гены домашнего хозяйства), тестовую (промоторы) и отрицательный контроль.

Запуск MEME

Далее был использован локальный MEME:

meme housekeeping.fasta -dna -nmotifs 3 -minw 6

Выдачу можно найти тут

1
Рис. 1 Выдача программы MEME. LOGO для первого мотива, E-value = 1.5e-017.
1
Рис. 2 Выдача программы MEME. LOGO для второго мотива, E-value = 6.0e-003.
1
Рис. 3 Выдача программы MEME. LOGO для третьего мотива, E-value = 4.3e-001.
У 2 и 3 мотивов довольно большой e-value (как мне кажется, они ненадёжны), поэтому далее я буду работать с 1-м.

Поиск сигнала в материале для тестирования с помощью FIMO

Для поиска второго найденного мотива в положительном и отрицательном контролях я использовала следующие команды:

fimo --norc -motif TTCCTYTT -thresh 0.001 ./meme_out/meme.txt ./promotors.fasta
fimo --norc -motif TTCCTYTT -thresh 0.001 ./meme_out/meme.txt ./negative.fasta

В результате работы программы я получила две таблицы c находками: для promotors и negative control соответственно. Мотив нашёлся в 457 промоторах положительного контроля и 21 негативного.