Поиск de novo сигналов в ДНК

Для этого задания я взяла решила взять геном бактерии Rickettsia rickettsii, внутриклеточного паразита, возбудителя пятнистой лихорадки Скалистых гор. Я нашла его последовательность генома и его описание. Далее с помошью программы Operon-mapper я получила список оперонов. Далее я использовала скрипт Георгия Муравьева, я получила 3 выборки: промоторы генов домашнего хозяйства (обучающая выборка), все промоторы (выборка тестирования) и случайные участки генома (негативный контроль).

Я использовала промоторы генов домашнего хозяйства. Я использовала команду:

meme housekeeping.fasta -dna -nmotifs 3 -minw 6

Я получила 3 изображения и HTML-страницу с отчетом:

af
Рис.1 Logo 1, E-value = 9.5e-011
af
Рис.2 Logo 2, E-value = 8.6e-003
af
Рис.3 Logo 3, E-value = 9.6e+000

С помощью программы FIMO я выполнила поиск первого мотива Logo 1 в положительном и отрицательном контроле. Я использовала команды:

fimo --norc -motif BHGGAACNAGAMDADCKKYAMYTCSAAGC -thresh 0.001 ./meme_out/meme.txt promotors.fasta HTML-отчет

В положиетльном контроле из 1439 послледовательностей 61 содержали мотива. Из негативного контроля из 105 последовательностей мотив был обнаружен только у 6.