Сигналы и мотивы

Создание позиционной весовой матрицы PWM для последовательностей Козак

Таблица с отчётом

Задание 4. Поиск сайтов регуляции разрывной транскрипции sgmRNA в полном геноме коронавируса.

Я выбрала вирус Severe acute respiratory syndrome-related coronavirus (SARS CoV), который послужил причиной эпидемии атипичной пневмонии в Китае в 2003 году и является близким родственником SARS-CoV-2.
Сначала из генома вируса были вырезаны последовательности перед началом гена каждого позднего протеина длиной 100 нуклеотидов. Результат представлен здесь.
Затем с помощью команды meme был выполнен поиск сигналов TRS в этих последовательностях. Выдача meme. Были найдены три консенсусных последовательности с удовлетворительным E-value, они представлены на рисунках ниже.


Этот мотив наиболее протяжённый и однородный, состоит из 50(!) нуклеотидов, и все они на каждой позиции зафиксированы. Он присутствует всего в двух последовательностях и не соответствует искомому.