Мотив Шайна-Дальгарно в геноме Desulfitobacterium metallireducens

Сбор, очистка и обрезка последовательностей производились при помощи кода ниже. Он получает на вход запись в формате gb (full) и выдает два fasta файла (см. ниже).

meme.fasta (n=40+1), fimo.fasta (n=1373)

Была использована веб-версия meme на meme.fasta (содержит 40 последовательностей + 16S РНК). После запуска сервер выдал команду, которую он использовал. В ней перечислены все параметры запуска:

meme meme.fasta -dna -oc . -nostatus -time 14400 -mod zoops -nmotifs 2 -minw 6 -maxw 10 -objfun classic -revcomp -markov_order 0

Результатом является мотив AAAGGAGG, который похож на последовательность Шайна-Дальгарно. DAAGGAGG_fasta.txt содержит мотив для каждой последовательности. DAAGGAGG.meme хранит в себе матрицы.

Судя по лого, мотив немного грязноват, но, думаю, что это связано с тем, что последовательность Шайна-Дальгарно в некоторых последовательностях находится немного дальше/ближе от/к ATG.

Далее в программе FIMO (с порогом p < 0.001) был произведен поиск мотивов по файлу fimo.fasta с матрицей DAAGGAGG.meme. Всего было найдено 733 мотива.