Назад

Для рассчёта матрицы PWM я использовал геном коронавируса из второго варианта. GC состав этого генома равен 40%. PWM.

Я выбрал коронавирус Bat coronavirus HKU5-1. У коронавирусов регуляторные последовательности располагаются перед каждым геном и имеют общий участок - CS. Поиск регуляторных последовательнсотей осуществлялся с помощью программы MEME. После первого запуска последовательности нашлись перед всеми генами кроме третьего. Для второго запуска длина участков перед всеми генами, кроме второго позднего, была сокращена, чтобы облегчить MEME поиск, а перед вторым поздним геном увеличена до 200 оснований. В результате сигнал нашёлся перед всеми генами, однако перед вторым поздними геном она находится на большом расстоянии и не очень похожа на консенсусную. Последовательность, расположенная перед четвртым поздним геном также не сильно совпадает с консенсусной. Скачать выдачу MEME.html.

Консенсусная последовательность - TWAACGAACT. Самый консервативный участок - AACGAA. Судя по всему, это CS.