Сигналы и мотивы

Задание 1: Создание позиционной весовой матрицы (PWM) для последовательностей Козак M.Musculus

Файл с результатом

Задание 2: Поиск сайтов регуляции разрывной транскрипции sgmRNA в полном геноме одного из коронавирусов (Coronaviridae)

Для выполнения данного задания На странице Genome NCBI (https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/) я запустила поиск по организмам из сем. Coronaviridae

Мною был выбран Betacoronavirus HKU24

В информации по сборке генома я нашла координаты начала и конца генов, чтобы оценить где расположены координаты upstream областей.

(upstream область = 100 нуклеотидов до начала самого гены). Исключение - upstream orf1ab - от 1 нукл до -1 относительно старта трансляции (> 100 п.о.).

Таким образом, я создала файл, содержащий таблицу с координатами upstream областей перед геном полипротеина (orf1ab) и перед каждым поздним геном.

С помощью команды seqret @upstreams -out upstreams.fasta я получила последовательности upstream областей.

Далее я использовала MEME, установленный на kodomo.

Команда meme upstreams.fasta -oc meme_dir -dna -snucleotide -nmotifs 3 -minw 6 -maxw 50 осуществляет поиск сайтов разрывной транскрипции в upstream областях.

Результаты

MEME, как и просили нашёл три мотива, второй из них показался мне наиболее правдоподобным из всех, он встретился в 5 последовательностях из 10. (Ниже картинка с генами, перед которыми есть данный мотив и LOGO мотива.)

Картиночка Картиночка