Практикум 8.Сигналы в геноме.Примеры и поиск сигналов с известными последовательностями

Задание 1.Краткое описание сигнала

Название сигнала:packaging signal(ψ/core encapsidation signal)
В чем состоит сигнал:Полипротеин Gag распознает уникальный сигнал упаковки на вирусной РНК (ψ, сигнал упаковки РНК) и присоединяет нуклеиновую кислоту (нуклеокапсид), транспортируя ее к локации формирования новых вирусных частиц(HIV или SIV)
Кому адресован:Белку Gag
Состав: 80–150 нуклеотидов, на 5' конце генома
Сила сигнала:Высокоэффективный сигнал

фото
img 1. Демонстрирует процессы упаковки генома ретровируса
Использованные источники:

Задание 2. Построение PWM последовательности Козак

PWM используются для определения консенсусных последовательностей и их вариабельности в наборе похожих биологических последовательностей, что позволяет исследовать потенциальные сайты связывания белков.Позиционная весовая матрица составляется по последовательности: NNNNNNNATGNN
Для создания моей позиционной весовой матрицы этой последовательности был использован скрипт старшекурсников.В результате создаются три файла: один содержит последовательности для обучения, другой - последовательности для тестирования, и третий файл включает в себя последовательности той же длины с случайным расположением АТГ, используемые в качестве негативного контроля.

фото
img 2. Гистограмма весов. Распределение элементов в обучающей и тестовой выборках очень схоже, в то время как распределение отрицательного контроля отличается смещением влево

Результаты проверки находок

IC матрица

фото
img 3. Изображение информационного потенциала последовательности. По данному прстоенному LOGOмы видим: в позициях 8-10 явно преобладает старт-кодон ATG, а в 5 позимии обнаруживается высокое содержание нуклеотидов GA