Учебный сайт Орлова Артёма

Практикум 7. Сигналы и мотивы.

Задание 1.

Матрица с информационным содержанием (IC) последовательностей Козак (вариант 4): xlsx.

Рис. 1

Рисунок 1. Выдача программы LOGO.

Так как IC выравнивания равно 10.39, сигнал достаточно слабый.

Задание 2.

Был осуществлён поиск FIMO мотива, найденного в предыдущем практикуме. Выдача FIMO представлена на Рис. 2. Получено 8 находок. Ранее, при поиске данного мотива, мотив был обнаружен тоже в 8 генах.

Параметры FIMO: fimo --oc . --verbosity 1 --thresh 1.0E-4 --norc motifs.meme sequence.fasta

Рис. 2

Рисунок 2. Выдача FIMO при поиске по изначальному геному коронавируса.

Для построения LOGO по последовательностям Козак было получено окружение (-4,4) поздних генов коронавируса (файл). Результат (Рис. 3) значительно отличается от последовательности Козак человека (оптимальный контекст для млекопитающих: GCCRCCAUGG).

Рис. 3

Рисунок 3. LOGO для последоватеьностей Козак коронавируса.

Для подтверждения правильности находки мотива для анализа были взяты другие коронавирусы: другой штамм того же вида (геном) и близкородственный вид (геном). При тех же параметрах был осуществлён поиск мотива по эти геномам (Рис. 4 и Рис. 5).

Рис. 4

Рисунок 4.Выдача FIMO для другого штамма.

Рис. 5

Рисунок 5.Выдача FIMO для другого вида.

В обеих выдачах оказалось по 7 удовлетворительных находок с низким p-value. Можно говорить, что мотив довтоверный. Однако данные таксономии говорят, что другой вид коронавируса относится к неклассифицированной группе. Таким образом, допустимо сходство в выдачах для трёх геномов, и нельзя точно утверждать о специфичности сигнала для вида.