Практикум 6. Сигналы и мотивы.
Задание 1. Создание позиционной весовой матрицы (PWM) для последовательностей Козак.
Задание 2. Поиск сигнала мотива.
Для поиска мотива сайта разрывной транскрипции субгеномной РНК был загружен геном короновируса из полногеномной сборки. Затем была составлена таблица upstream-областей перед генами (csv-файл) и получен файл с последовательностями upstream-областей генов (fasta-файл).
Параметры анализа MEME: meme upstream_reg.fasta -dna -oc . -nostatus -time 14400 -mod zoops -nmotifs 3 -minw 6 -maxw 50 -objfun classic -revcomp -markov_order 0
Результаты поиска мотива: лого первого в списке мотива, три находки и расположение мотивов в upstream-областях генов (первый мотив отмечен красным цветом).
В качестве Core Sequence был выбран первый мотив, так как он встречается у 8 из 11 генов и имеет низкое E-value.
По последовательностям мотива и его окружения в 8 последовательностях была построена PWM-матрица.