Сигналы и мотивы

PWM

Я выбрал последовательность Козак Oryzias latipes, Японской оризии. Расчеты позиционной матрицы сделал в питоне. Ссылка на скрипт. Ниже представлена, полученная PWM.

-3 -2 -1 1 2 3 4
A 0.683197 0.243246 -0.136244 1.220780 -3.394341 -3.394341 0.102167
C -0.950934 0.370822 0.753814 -3.030375 -3.030375 -3.030375 -0.833151
G 0.370822 -0.085936 0.227721 -3.030375 -3.030375 1.584745 0.730825
T -1.448430 -0.561127 -1.314899 -3.394341 1.220780 -3.394341 -0.449902

Я выбрал геном Bulbul coronavirus HKU11 для поиска сайтов регуляции разрывной транскрипции sgmRNA.
Для поиска CS я взял -100, +1 фрагменты генома вируса относительно последовательности Козака. Затем я попробовал прогнать на них программу MEME – результат не очень впечатлял, E-value найденных мотивов был очень большой. Затем я пробовал делать запуски варьируя длину фрагментов – всё так же без положительного результата. Тогда я решил попробовать запустить программу chipmunk (в режиме single RNA strand) и был найден мотив с p-value 2e-16 – это очень хорошо. Консенсус для этого мотива: GnWdRnAMWCCAWWCC.

Последовательности
Результаты MEME
Результаты ChipMunk

Назад

©Бакулин Артемий, 2018