Практикум 9. Поиск сигнала в промоторах оперонов в геноме бактерии.

Подготовка данных:
1. Скачаем Fasta хромосомы бактерии (пусть будет E.coli).
Хромосома (GenBank ID: BA000007.3)
2. Найдём опероны в этой хромосоме. Будем использовать Operon-mapper.
Опероны
3. Сделаем материал тестирования, материал обучения и отрицательный контроль. Материалы тестирования и обучения будут состоять из последовательностей промоторов (100 нуклеотидов до оперона). Отрицательный контроль - участки ДНК, не пересекающиеся с промоторами.
Для этой работы был взят скрипт Сергея Бушуева
Материал тестирования
Материал обучения
Отрицательный контроль

Запуск MEME: Будем использовать сервис MEME-suite

meme.png
Настройки MEME
motif.png
Единственный мотив с подходящим E-value: AMMTRWTNSNGGBTNGYMYNYNGCAKSATTMAWATGSGATA

Запуск FIMO: Будем запускать на кодомо, используем файл, полученный с помощью MEME.
fimo -motif AMMTRWTNSNGGBTNGYMYNYNGCAKSATTMAWATGSGATA -text -norc meme.txt test.fasta > test_out.txt
fimo -motif AMMTRWTNSNGGBTNGYMYNYNGCAKSATTMAWATGSGATA -text -norc meme.txt neg_contr.fasta > neg_contr_out.txt
Мы запустили fimo на кодомо с опциями: -text, -motif (выбранный мотив), -norc (в выборке у нас только + цепи)
test_out.txt neg_contr_out.txt

Рассмотрим полученные данные и обсудим результаты: MEME хоть и выдал нам не самый лучший мотив (E-value всё-таки очень большой), FIMO в отрицательном контроле нашёл 4 мотива, а в материале тестирования - 9. К сожалению, p-value в обоих случаях низкие. Однако то, что FIMO нашёл больше мотивов в материале тестирования, чем в отрицательном контроле, можно считать за частичный успех.

Назад