Практикум 6. Сигналы и мотивы.

Сигнал транспозазы

attTn7 - нуклеотидная последовательность, которая распознается белком TnsD, который является частью бактериальной транспозазы Tn7. При узнавании происходит привлечении дополнительных белков комплекса, которые встраивают транспозон в upstream attTn7 сайта. Такие события происходят с достаточно высокой частотой. Сылка: Target Site Selection by Tn7: attTn7 Transcription and Target Activity

Построение PWM

С использованием кода выше было отобрано 100 генов человека на + цепи для простоты, были взяты участки от -7 нуклкотида от координаты старт-кодона до +400 нуклеотида после. Ссылка на файл

Далее были вырезаны участки размером 13 нуклеотидов в начале генов, из них были отобраны участки, содержащие старт кодон. Полученные последовательности были разделены на 40 для построения PWM, и 36 для теста. Негативный котроль был сформирован из участков вокруг кодонов AUG, удаленных минимум на 200 нуклеотидов от начала гена, таким образом не являющихся старт-кодонами.

PWM была реализована в виде класса с методами для построения PWM, вычисления весов тестовых последовательностей, вычисления матрицы информационного содержания и вывода матриц. Для вычисления базовых частот нуклеотидов был взят GC состав 40.4

Матрица была построена на основании полученных ранее последовательностей и протестирована на положительном и отрицательном контроле, оба по 36 последовательностей. Ниже представлен результат непараметрического теста Манна-Уитни наборов полученных весов. Видно, что при уровне значимости 0.05, вес положительного контроля выше веса отрицательного.

Матрица информационного содержания

Выше представлена матрица информационного содержания для последовательностей, использованных для построения PWM. На рисунке ниже LOGO для этих последовательностей.