pano

Сигналы и мотивы 2

Подготовка данных

Для этого практикума был выбран геном Yersinia pestis (fasta-файл). Далее с помощью сервиса Operon-mapper был получен файл с предсказанными оперонами. Промотором считается область 100 нуклеотидов перед началом оперона. С помощью скрипта (был взят у Г.Муравьёва) были получены 3 файла: обучения (гены домашнего хозяйства), тестирования и негативного контроля.

Запуск MEME

Был использован локальный MEME:

meme ./housekeeping.fasta -dna -nmotifs 3 -minw 6

(output-файл)

Всего было найдено три мотива: LOGO-1 (рис. 1, E-value = 1.5e-018), LOGO-2 (рис.2, E-value = 5.1e+000), LOGO-3 (рис.3, E-value = 2.1e+002). У всех трех мотивов не очень низкий по значению E-Value. Далее я выбрала первый мотив, так как он обладатель минимального E-Value).

Рисунок 1. LOGO-1. E-value = 1.5e-018
Рисунок 2. LOGO-2. E-value = 5.1e+000
Рисунок 3. LOGO-3. E-value = 2.1e+002

Поиск сигнала в материале для тестирования с помощью FIMO

Для поиска выбранного мотива в контролях был использован FIMO:

fimo --norc -motif ACAHTRVAAGAWGTYGCKNWWMWRGCNGGKGTWTCWWWWRYRACSGTNTC -thresh 0.001 ./meme_out/meme.txt ./meme_out/promotors.fasta

fimo --norc -motif ACAHTRVAAGAWGTYGCKNWWMWRGCNGGKGTWTCWWWWRYRACSGTNTC -thresh 0.001 ./meme_out/meme.txt ./meme_out/negative.fasta

В результате работы программы полусились следующие таблицы: positive и negative. Этот мотив был найден в 395 промоторах среди всех и в 19 находках в негативном контроле.