Практикум 7.

Подготовка данных

Для этого задания я выбрала бактерию Pseudomonas aeruginosa(штамм PAO1). Для этой бактерии был скачен fasta файл с ее хромосомой из GeneBank, а также файл с координатами ORF. Потом воспользовавшись веб-сервисом Operon-mapper, был получен файл со списоком найденных оперонов.
При помощи скрипта Сергея Бушуева(автор выражает ему свою большую благодарность) были получены следующие файлы:

.

Запуск MEME

Был произведен локальный запуск MEME. Текстовую выдачу можно посмотреть по ссылке.

meme train.fasta -dna -nmotifs 3 -minw 6

Было найдено три мотива:

Только первый мотив проходит порог значимости, поэтому было решено продолжить работу с ним. Остальные мотивы имеют большое E-value и слишком маленькую длину.

Рис.1logo 1 мотива
Рис.2logo 2 мотива
Рис.3logo 3 мотива

Запуск FIMO

Был произведен запуск FIMO для положительного и отрицательного контроля

fimo -thresh 0.001 meme.txt Test.fasta

fimo -thresh 0.001 meme.txt Negative.fasta

В положительном контроле нашлось 130 находок в 148 последовательностях. Можно сделать вывод, что ложных находок присутствует мало.
В отрицательном контроле нашлось 40 мотивов в 33 последовательностях.