Таблица

Поиск сайтов регуляции разрывной транскрипции sgmRNA

Мной был выбран вирус Camel alphacoronavirus (NC_028752), для него были получены upstream последовательности для всех его генов (6 штук) - для первой рамки выбран участок от 1 нуклеотида, для остальных в пределах 100 нуклеотидов. Последовательности были обработаны сервисом MEME Suit, в результате были найдены мотивы на картинке ниже.

С первой попытки нашлась лишь одна находка с E-value < 1 (красный цвет на первом рисунке). Она встретилась в 5 из 6 генов (не было перед геном E) и была довольно консервативной.

Последовательности были обрезаны, не несущая находку удалена. При таком поиске E-value ожидаемо уменьшилось и составило 10^-9. На рисунке ниже лого итогового варианта и E-value:
Итоговой записью мотива стала TCTMAACTAAACG. Сравнил его с чужими находками (тоже своего рода литература) - похоже, это как раз то, что нужно.