Практикум 9.Сигналы в геноме.Сигналы в геноме. Поиск de novo сигналов в ДНК
Подготовка данных
Я решила взять бактерию Clostridium Botulinum, обосновывая свой выбор, что эта бактерия производит ботулинический токсин, самый сильный из известных токсинов и предоставляет интнрес для изучения
NCBI RefSeq assembly: GCF_000063585.1
Submitted GenBank assembly: GCA_000063585.1
Taxon: Clostridium botulinum A str. ATCC 3502
Используя скаченные файлы с ДНК-последовательностями (.fasta) и аннотациями (.gff) был сформирован список оперонов(используя Operon-mapper). Промотором будем считать 100 нуклеотидов до оперона. Далее использовался скрипт старших курсов
Получаем три файла:
housekeeping.fasta обучающая выборка
promotors.fastaтестовая выборка
negative.fastaнегативный контроль
MEME
Пользовалась MEME-suit(параметры :1)site distribution-0 или 2) number of motifs- по умолчание 3 3)as the background model- 0-order 4)минимальная-максимальная длина мотива 6-50
Выдача meme txt Выдача meme htmlМЕМЕ нашел три мотива, logo которых представлены ниже:
img 1. Мотив 1: MOTIF TCCTCCMY, width = 8, E-value = 4.6e-055
img 2. Мотив 2: MOTIF GGAGGW, width = 6, E-value = 1.6e-036