Сигналы и мотивы
PWM
Я выбрал последовательность Козак Oryzias latipes, Японской оризии. Расчеты позиционной матрицы сделал в питоне. Ссылка на скрипт. Ниже представлена, полученная PWM.
-3 | -2 | -1 | 1 | 2 | 3 | 4 | |
---|---|---|---|---|---|---|---|
A | 0.683197 | 0.243246 | -0.136244 | 1.220780 | -3.394341 | -3.394341 | 0.102167 |
C | -0.950934 | 0.370822 | 0.753814 | -3.030375 | -3.030375 | -3.030375 | -0.833151 |
G | 0.370822 | -0.085936 | 0.227721 | -3.030375 | -3.030375 | 1.584745 | 0.730825 |
T | -1.448430 | -0.561127 | -1.314899 | -3.394341 | 1.220780 | -3.394341 | -0.449902 |
Я выбрал геном Bulbul coronavirus HKU11 для поиска сайтов регуляции разрывной транскрипции sgmRNA.
Для поиска CS я взял -100, +1 фрагменты генома вируса относительно последовательности Козака. Затем я попробовал прогнать на них программу MEME – результат не очень впечатлял, E-value найденных мотивов был очень большой. Затем я пробовал делать запуски варьируя длину фрагментов – всё так же без положительного результата. Тогда я решил попробовать запустить программу chipmunk (в режиме single RNA strand) и был найден мотив с p-value 2e-16 – это очень хорошо. Консенсус для этого мотива: GnWdRnAMWCCAWWCC.
Последовательности
Результаты MEME
Результаты ChipMunk
©Бакулин Артемий, 2018