© Kholina Tatiana, 2013 You can contact me at tatiana96-khol@yandex.ru

На самом деле надо брать область [-17:-1] и ставить ограничения на длину 5-7 нн

Из хромосомной таблицы генома бактерии Chlamydia trachomatis Sweden2 (NC_017441.gff) были выбраны координаты начала CDS. От них были отсчитаны координаты [-35:-1], и переведены в вид, который считывает seqret: coords_all.txt. Командой seqret @coords_all.txt list_all.fasta были получены последовательности -35:-1 CDS хламидии (list_all.fasta). Из этих последовательностей было выбрано 55 и подано программе MEME на этом сервере. Параметры были: длина от 4 до 10, Zero or one per sequence, число мотивов 4. На выходе было несколько файлов, в том числе html-страница. Я посчитала, что первый мотив наиболее похож на Шайн-Дальгарно, т.к. его консенсусом обычно является AGGAGG.

Рис.1. LOGO первого мотива, выданного MEME

Этот мотив был подан программе MAST на том же сайте и программе emast на кодомо. E-value ставилось меньше 50. Обе программы выдали схожие результаты: [1], [2]. Программа пишет, что нашлось 77 последовательностей, однако графики пустуют, и на них не отмечено ни в каком месте нашелся мотив, ни нашелся ли он вообще.

Я попыталась повторить поиск, пользуясь программой ememe на kodomo. Команда: ememe -minw 5 -maxw 12. Был найден похожий мотив:

Дальше я повторила поиск emast (команда emast out/meme.txt -dfile list_all.fasta mast.html, порог E-value 50), но он выдал тот же результат. Непонятно, в чем причина, т.к. последовательность AGGAGC встречается как минимум в 15 последовательностях из списка.