Скачать результаты подсчета IC
Проверка найденных мотивов
Сначала я решила проверить мотив, найденный программой MEME в области, предшествующей поздним генам.
Результаты поиска FIMO
FIMO находит 8 из 9 мотивов, как и MEME, перед геном полипротеина и поздних генов. Еще 2 мотива найдены внутри полипротеина. Мотив обладает следующими характеристиками:
1. Длина мотива — 9, что несколько отклоняется от идеальной в меньшую сторону.
2. Сигнал есть перед геном полипротеина.
3. Сигнал есть перед 7 из 8 поздних генов на участке в 100 нуклеотидов.
4. Сигналы, соответствующие мотиву, находятся только внутри гена полипротеина, что может отражать альтернативную инициацию транскрипции/трансляции.
5. Низкий e-value, что отражает маловероятность нахождения мотива случайно.
Поиск последовательности Козак в геноме вируса
MEME находит последовательность Козак в геноме вируса. Интересно, что старт-кодон не присутствует во всех последовательностях (находится в 6 из 9), а что-то похожее на последовательность Козак находится в 7 из 9 последовательностях. В двух последовательностях (генов E, M) последовательности найдены не были.
Я решила повторить поиск, заставив программу найти по одному мотиву на каждой последовательности.
Выдача MEME
Построенное лого.
Мотивы, проверенные с помощью FIMO. Последовательность, аналогичная последовательности Козак, находится далеко не перед всеми генами, что может свидетельствовать о том, что часть генов может транслироваться немного иначе.
Сравнение последовательности Козак
Лого для вируса.
Консенсусное лого для последовательности Козак человека.
При сравнении последовательность были найдены схожести по позициям -6, -5, -4, 3, -2, -1, +4, +6. Достаточно высокая степень похожести последовательностей может свидетельствовать о хорошей транскрипции в человеческих клетках. Но для части генов старт-кодон сдвинут (ORF3, M), а для гена E не находится в аннотированных координатах.
Поиск мотива в другом штамме данного вида
Был выбран вирус SARS, который привел к пандемии в Китае в 2002 году.
Лого для вируса SARS-Cov-2.
Лого для вируса SARS-Cov.
В геноме ближайнего родственника вируса был найден практически такой же мотив, что показывает видоспецифичность мотива.
Для определения специфичности мотива на более высоких таксонов, был выбран геном вируса MERS (подсемейство бетакоронавирусов).
Лого для вируса MERS.
Похожая последовательность находится и у этого вируса, что говорит о ее специфичности как минимум для подсемейства.