6.Практикум 6

Создание позиционной весовой матрицы (PWM) для последовательностей Козак одного из организмов

В качестве исследуемого органзима был выбран Betacoronavirus Erinaceus/VMC/DEU/2012, относящийся к коронавирусам.Были получены upstream последовательности до гена orf1ab и для всех 10 поздних генов. При этом анализировались 100 нуклеотидов до каждого из поздних генов. Последовательности были обработаны MEME Suit, в результате запуска которого были найдены следующие мотивы.

image

Видно, что мотив, встречающийся во всех последовательностях - WTAACGAAYT. Далее был осуществлен поиск только по 1 мотиву.

image

Так как значения p-value и e-value (1.2e-006) были достаточно большими, были удалены нуклеотиды спереди от мотива и оставлено по 4 нуклеотида сзади. В итоге значения p-value и e-value (2.8e-020) уменьшились

image

Исходя их полученного LOGO можно предположить, что CS последовательностью является ACGAAC.

image