Моя бактерия - это Pseudoalteromonas piscicida (NCBI RefSeq assembly GCF_000238315.3)
Ее геном АннотацияЯ воспользовалась готовыми скриптом, который выдает 3 файла: область перед старт кодоном( тут обычно находится сигнал SD), последовательность после старт кодона (тут не должно встречаться SD), и обуччающая выборка с генами, у которых SD наиболее консервативны
Для МЕМЕ была использована следующая команда: meme TRAIN.fasta -dna -nmotifs 1 -minw 5 -maxw 10
С помощью MEME был выявлен мотив длиной 10 нуклеотидов. Логотип последовательности показывает, что в нём преобладают нуклеотиды TAT в начале и GG в конце. Данный мотив не совпадает с каноническим Shine–Dalgarno (AGGAGG)
Далее были использованы команды, где p-value<0.001 : fimo --oc fimo_p -thresh 0.001 meme.txt ../POSITIVE.fasta
fimo --oc fimo_p -thresh 0.001 meme.txt ../../NEGATIVE.fasta
Я сомневаюсь, что TATTTWKAGG является верным мотивом, потому что разница между количеством находок в промоторных областях и областях после старт кодона невелика (359 и 251). Для истинного сигнала SD ожидалось бы заметно большее число совпадений именно в промоторных областях