Сигналы и мотивы 2

IC матрица

Проверка PWM для сайтов регуляции разрывной транскрипции sgmRNA

Полученный мотив (YTMAACTAAAC) из практикума 6 был проверен при помощи программы FIMO.
Поиск при помощи этой программы был осуществлен в геноме самого вируса Rhinolophus bat coronavirus HKU2 и Bat coronavirus CDPHE15/USA/2006 из того же семейства Alphacoronavirus.
Выходы FIMO:
Rhinolophus bat coronavirus HKU2
Bat coronavirus CDPHE15/USA/2006

Как и ожидалось в обоих случаях p-value порядка e-05 - e-06. В геноме вируса откуда "родом" мотив, однозначно нашлись все 7 последовательностей. В геноме родственного вируса порядок p-value такой же, возможно этот мотив выполняет какие-то важные функции.


Рисунок 1. FIMO для исходного вируса


Рисунок 2. FIMO для родственного вируса

Последовательность Козака


Рисунок 3. Последовательность Козака для вируса.

Для получения последовательности Козака для вируса Rhinolophus bat coronavirus HKU2 из каждого гена был вырезан участок -9..4, где 0- начало рамки считывания гена. Для получения адекватной выдачи MEME пришлось настроить некоторые параметры:
meme result_2.fasta -dna -oc . -nostatus -time 18000 -mod oops -nmotifs 1 -minw 6 -maxw 13 -objfun classic -markov_order 0
Сама последовательность напоминает отдаленно человеческую на позициях -2 и -3 от ATG.