Поиск сайтов регуляции разрывной транскрипции sgmRNA

В этом задании нужно было найти Core Sequense в sgmRNA COVID-19. Для выполнения этого задания я выбрала штамм короновируса Munia coronavirus HKU13. Скачать геном можно по ссылке.

Для поиска Core Sequence я сначала создала файл с upstream областями. Для этого я сделала файл с координатами участков генома перед кодирующими участками длиной 101 пара нуклеотидов. Ссылка на файл.

При помощи команды seqret @coords.txt -out seq.fasta и заменив названия последовательностей, я получила файл с upstream последовательностями.

Применив к файлу с upsream последовательностями команду meme seq.fasta -dna -oc result -nostatus -time 18000 -mod zoops -nmotifs 3 -minw 6 -maxw 50 я получила последовательности.

Самая первая последовательность оказалась наиболее подходящей. Выдачи MEME представлены рисунках 1 и 2.

Вырыванивание

Рисунок 1.

Выравнивание 2

Рисунок 2.

LOGO последовательности представлен на рисунке 3.

LOGO

Рисунок 3.

*Ниже представлена табличка с весовой матрицей PMW:

Табличка.