Назад
Для рассчёта матрицы PWM я использовал геном коронавируса из второго варианта. GC состав этого генома равен 40%.
PWM.
Я выбрал коронавирус Bat coronavirus HKU5-1. У коронавирусов регуляторные последовательности располагаются перед каждым геном и имеют общий участок - CS.
Поиск регуляторных последовательнсотей осуществлялся с помощью программы MEME. После первого запуска последовательности нашлись перед всеми
генами кроме третьего. Для второго запуска длина участков перед всеми генами, кроме второго позднего, была сокращена, чтобы облегчить
MEME поиск, а перед вторым поздним геном увеличена до 200
оснований. В результате сигнал нашёлся перед всеми генами, однако перед вторым поздними геном она находится на большом расстоянии и не очень
похожа на консенсусную. Последовательность, расположенная перед четвртым поздним геном также не сильно совпадает с консенсусной. Скачать выдачу
MEME.html.
Консенсусная последовательность - TWAACGAACT. Самый консервативный участок - AACGAA. Судя по всему, это CS.