Практикум 9.Сигналы в геноме.Сигналы в геноме. Поиск de novo сигналов в ДНК
Подготовка данных
Я решила взять бактерию Clostridium Botulinum, обосновывая свой выбор, что эта бактерия производит ботулинический токсин, самый сильный из известных токсинов и предоставляет интнрес для изучения
NCBI RefSeq assembly: GCF_000063585.1
Submitted GenBank assembly: GCA_000063585.1
Taxon: Clostridium botulinum A str. ATCC 3502
Используя скаченные файлы с ДНК-последовательностями (.fasta) и аннотациями (.gff) был сформирован список оперонов(используя Operon-mapper). Промотором будем считать 100 нуклеотидов до оперона. Далее использовался скрипт старших курсов
Пользовалась MEME-suit(параметры :1)site distribution-0 или 2) number of motifs- по умолчание 3 3)as the background model- 0-order 4)минимальная-максимальная длина мотива 6-50
Выбрала мотив 2 c наименьшим E-value: GGAGGW (хоть и смущет по длине)
FIMO
Для поиска мотива в положительном и отрицательном контроле были запущены следующие команды(С классическим порогом p-value до 0.05, поиск только по одной цепи (--norc)):