Практикум 7. СИГНАЛЫ И МОТИВЫ II

Сначала было построено LOGO для последовательности Козак короновируса из прошлого практикума.
Его можно сравнить с аналогичным для человека:
Видно, что между ними мало общего.

Проверка мотива для сайтов регуляции разрывной транскрипции sgmRNA

Далее выполнялась задача, обратная предыдущему практикуму - по мотиву искались совпадения в геноме. С помощью программы Fimo были получены находки сигнала в том же геноме. Мотив встретился 10 раз, в том числе во всех 5 участках перед генами, где он и был найден в прошлом задании. 6 находка в принципе находится перед тем геном, в upstream последовательности которого MEME не нашел нужного мотива, но выглядит уже совсем не похоже на то, что нужно (6 строка на рисунке). В то же время, для многих последовательностей, находящихся ниже в выдаче, центральная часть полностью соответствует мотиву, по которому велся поиск, а она, как я понимаю, и является ключевым сигналом сегментации РНК.
Затем выполнен поиск по тому же мотиву для двух близкородственных видов (другого штамма того же вида - 229E-related bat coronavirus strain BtKY229E-1 и другого вида того же рода - Rousettus aegyptiacus bat coronavirus 229E-related isolate 5425)
Видно, что мотив нашелся и у них, но локализован в несколько других участках. Инетесно, что даже между двумя штаммами координаты довольно сильно различаются.