Поиск сайта разрывной транскрипции sgRNA в геноме коронавирусов

Выбор организма

В данной работе было решено использовать коронавирус ближневосточного респираторного синдрома (MERS-CoV) - один из первых коронавирусов, ставший причиной крупной эпидемии в Саудовской Аравии в 2017г. [1]

Подготовка данных к работе

Сборка полного генома MERS-CoV в формате gbff была скачана из GenBank по AC GCA_002816195.1. С помощью программы SnapGene Viewer вручную были выбраны upstream области генов (максимальной длины - 100 bp, но при наличии старт-кодона, он выбирался левой границей).
С последовательностями можно ознакомиться по ссылке.

Запуск MEME

Подготовленный fasta-файл был использован в сервисе MEME Suit для поиска мотивов. Максимальное число находок установлено на 3, длина мотивов - от 6 до 50 bp.
С выдачей можно ознакомиться по ссылке.

Предсказанные MEME сигналы

В во всех последовательностях нашелся мотив длиной 10 bp UUAACGAACU (жирным выделены позиции, одинаковые во всех последовательностях) с IC = 16.5. Этот сигнал, предположительно, является TRS-L CS.

Проверка полученной PWM

Для проверки построенной по выбранному мотиву PWM был использован полный геном MERS-CoV и сервис FIMO. Результат можно увидеть по ссылке.
Как и ожидалось, последовательность TRS-L CS была найдена перед всеми генами. Никаких дополнительных находок не присуствует, что говорит о правильности выполненных операций.

*Поиск CS в геноме SARS-CoV-2

Мне было интересно, насколько похожи TRS-L CS у MERS-CoV и современного SARS-CoV-2. Для этого был скачан полный геном SARS-CoV-2 (GenBank) и в нем была произведена попытка поиска TRS-L CS по PWM, построенной с использованием upstream-областей MERS.
С результатом можно ознакомиться по ссылке.

В выдаче нашлись только 3 предполагаемые последовательности TRS-L, что позволяет предположить различия между разными родами Coronaviridae. Действительно, эти последовательности довольно консервативны в пределах одного рода, но отличаются у разных. [2]
Загвоздка заключается в том, что обы MERS- и SARS-CoV принадлежат одной группе Betacoronavirus и, по данным приведенной выше статьи (ref. 2), имеют одинаковую последоватпельность TRS-L. Возможно, сервис MEME не совсем точно осуществляет поиск в пределах разных организмов, либо я сделал что-то неправильно (второй вариант вероятнее...).

References

  1. The rapid journey of a deadly MERS outbreak // Nature Portfolio
  2. Yang Y. et al. Characterizing transcriptional regulatory sequences in coronaviruses and their role in recombination //Molecular Biology and Evolution. – 2021. – Т. 38. – №. 4. – С. 1241-1248.