PWM и Human coronavirus HKU1
Выдача MEME по upstream-последовательностям длиной 100 всех 8 генов Human coronavirus HKU1
(Primary) Sequences: A set of 10 DNA sequences, between 61 and 101 in length (average length 97.0) Background: A 0-order background model generated from the supplied sequences (использовать частоты букв во введенных последовательностях как базовые частоты). Discovery Mode Classic: optimizes the E-value of the motif information content Site Distribution: Zero or one occurrence (of a contributing motif site) per sequence. Motif Count: Searching for 3 motifs. Motif Width: Between 6 wide and 50 wide (inclusive). No RC: Motif sites will only be considered if they are on the given strand (разумеется, так как геном представлен одноцепочечной РНК)
В геноме коронавирусов (в upstream-участки) необходимо было найти сайты регуляции разрывной транскрипции sgmRNA: TRS. Согласно обзору [1] у всех коронавирусов есть на upstream участках генов ключевая консервативная поледовательность: core sequence (CS). Можно попробовать её найти у нашего вируса. MEME выдал несколько мотивов, из которых нас интересут только первый. HCoV‐HKU1 относится ко второй группе вирусов по классификации в обзоре, CS для них: 5'‐AAUCUAAAC‐3' [1]. Мой мотив: 5'-TTAAATCTAAAC-3' в точности соответствует предполагаемому и дополнительно содержит ещё три нуклеотида с 5' конца.