В этом задании нужно было найти Core Sequense в sgmRNA COVID-19. Для выполнения этого задания я выбрала штамм короновируса Munia coronavirus HKU13. Скачать геном можно по ссылке.
Для поиска Core Sequence я сначала создала файл с upstream областями. Для этого я сделала файл с координатами участков генома перед кодирующими участками длиной 101 пара нуклеотидов. Ссылка на файл.
При помощи команды seqret @coords.txt -out seq.fasta и заменив названия последовательностей, я получила файл с upstream последовательностями.
Применив к файлу с upsream последовательностями команду meme seq.fasta -dna -oc result -nostatus -time 18000 -mod zoops -nmotifs 3 -minw 6 -maxw 50 я получила последовательности.
Самая первая последовательность оказалась наиболее подходящей. Выдачи MEME представлены рисунках 1 и 2.
Рисунок 1.
Рисунок 2.
LOGO последовательности представлен на рисунке 3.
Рисунок 3.
*Ниже представлена табличка с весовой матрицей PMW: