Подготовка данных
Для поиска оперонов в геноме я выбрала бактерию Pseudomonas aeruginosa str.
PSE305 (GCA_000750905.1). Для поиска оперонов использовался Operon-mapper , на вход которому был подан файл fasta c геномом выбранной бактерии. На выходе был получен файл со списком всех найденных оперонов.
Для дальнейшей подготовки данных был использован скрипт Георгия Муравьёва . Промотором было решено считать 100 нуклеотидов перед опероном.
Получили на выход:
MEME
Команда:
meme housekeeping.fasta -dna -mod zoops -nmotifs 3 -minw 6 -maxw 50 -maxsites 50
Результат команды: файл
Рис 1. LOGO первого мотива
Рис 2. LOGO второго мотива
Рис 3. LOGO третьего мотива
Мотивы:
Поиск сигнала с помощью FIMO
С помощью FIMO проводился поиск выбранного мотива в тестовой группе и в группе негативного контроля.
В результате при пороге 0,001 было найдено 164 мотива в тестовой группе (promotors_fimo.tsv) и 3 в негативной группе ( negative_fimo.tsv).