PWM и Human coronavirus HKU1

Мини-КР про PWM

Выдача MEME по upstream-последовательностям длиной 100 всех 8 генов Human coronavirus HKU1

Выдача MEME по upstream-последовательностям длиной 100 всех 8 генов Human coronavirus HKU1 в формате html

(Primary) Sequences:	A set of 10 DNA sequences, between 61 and 101 in length (average length 97.0)
Background:	A 0-order background model generated from the supplied sequences (использовать частоты букв во введенных последовательностях как базовые частоты).
Discovery Mode	Classic: optimizes the E-value of the motif information content
Site Distribution:	Zero or one occurrence (of a contributing motif site) per sequence.
Motif Count:	Searching for 3 motifs.
Motif Width:	Between 6 wide and 50 wide (inclusive).
No RC:	Motif sites will only be considered if they are on the given strand (разумеется, так как геном представлен одноцепочечной РНК)

В геноме коронавирусов (в upstream-участки) необходимо было найти сайты регуляции разрывной транскрипции sgmRNA: TRS. Согласно обзору [1] у всех коронавирусов есть на upstream участках генов ключевая консервативная поледовательность: core sequence (CS). Можно попробовать её найти у нашего вируса. MEME выдал несколько мотивов, из которых нас интересут только первый. HCoV‐HKU1 относится ко второй группе вирусов по классификации в обзоре, CS для них: 5'‐AAUCUAAAC‐3' [1]. Мой мотив: 5'-TTAAATCTAAAC-3' в точности соответствует предполагаемому и дополнительно содержит ещё три нуклеотида с 5' конца.

###
Рисунок 1. LOGO самого интересного из мотивов, встречается в 5 из 8 последовательностей (не 100% консервативные нам, скорее всего, не интересны, т. е. полностью консервативный мотив: 7-18. Но то, что у трёх генов верхний вариант, а ещё у двух нижний, весьма любопытно, можно посмотреть потом на их функцию.).

Источники информации:

  1. doi.org/10.1016/S0065-3527(06)66005-3