Сигналы и мотивы - 2


Подготовка данных


Для выполнения практикума был выбран геном Thermogutta terrifontis штамм R1 (fasta-файл). Далее с помощью сервиса Operon-mapper был получен файл с предсказанными оперонами. Промотором считается область 100 нуклеотидов перед началом оперона. С помощью скрипта были получены 3 файла: обучения (гены домашнего хозяйства), тестирования и негативного контроля.


Запуск MEME


Далее был использован локальный MEME:

meme ./pr7/hk.fasta -dna -nmotifs 3 -minw 6
(output-файл)

Было найдено три мотива: LOGO-1 (рис. 1, E-value = 8.3e+000), LOGO-2 (рис.2, E-value = 1.8e+000), LOGO-3 (рис.3, E-value = 1.4e+002). У всех трех мотивов очень высокий по значению E-Value. Для дальнейшей работы был выбран второй мотив (из-за минимального E-Value).

Рисунок 1. LOGO-1. E-value = 8.3e+000
Рисунок 2. LOGO-2. E-value = 1.8e+000
Рисунок 3. LOGO-3. E-value = 1.4e+002

Поиск сигнала в материале для тестирования с помощью FIMO


Для поиска выбранного мотива в положительном и негативном контроле был использован FIMO:

fimo --norc -motif ACNYWWCCACNCYBWCAAGSYWSTATHATBTYNKCYCCMM -thresh 0.001 ./pr7/meme_out/meme.txt ./pr7/promotors.fasta
fimo --norc -motif ACNYWWCCACNCYBWCAAGSYWSTATHATBTYNKCYCCMM -thresh 0.001 ./pr7/meme_out/meme.txt ./pr7/negative.fasta

Получены следующие таблицы: positive и negative. Этот мотив был найден в 220 промоторах среди всех и в 8 находках в негативном контроле.