Задания практикума 6

1. Cигнал, закодированный в геноме

Secis - структурный элемент на мРНК, необходимый для вставки двадцтать первой аминокислоты - селеноцестеина.

У селеноцестеина есть своя тРНК (Sec-тРНК), узнает стоп-кодон UGA (как и фактор терминации RF2). Также известно, что Sec-тРНК не узнаётся EF-Tu (фактор элонгации пептидной связи). Поэтому сама по себе вставку селеноцестеина неэффективна, без дополнительного сигнала.

UGA узнаётся Sec-тРНК только в белках, в кот должен быть Sec. В их мРНК на нек расстоянии от нужного UGA (разное у разных организмов) есть шпилька Secis (“Selenocysteine insertion”), которая узнаётся SelB — аналогом EF-Tu. SelB приносит в P-сайт рибосомы только Sec-тРНК.

Источник: August Böck, Selenoprotein Synthesis, Encyclopedia of Biological Chemistry, Elsevier, 2004, Pages 17-21, https://doi.org/10.1016/B0-12-443710-9/00616-5.

2. Построение и проверка позиционной весовой матрицы (PWM) для последовательности Козак человека

Я исследовала последовательности Козак на Х хромосоме прямой цепи человека. Для этого я написала скрипт, который можно посмотреть по ссылке.

Кратко ход работы. Я отобрала 100 последовательностей, состоящих из "7нк + ATG + 3нк". 40 из них - отдала на train, 60 - на test. Для отрицательного контроля отобрала 60 последовательностей внутри генов на Х хромосоме. Построила для каждой PWM, посчитала IC для каждой последовательности.

Я работала с файлами с последовательностями: train test negative

Обсуждение полученных в ходе работы результатов

Полученная PWM
Сравнение весов PWM для положительного и отрицательного контролей

1 - положительный контроль 2 - отрицательный контроль

Тестом Манна-Уитни было посчитано p-value. p-value = 2.1025e-05. Это говорит о том, что различие между двумя выборками значимое.

Значит, действительно можно предположить, что отобранные для положительного контроля последовательности -- содержат сигнал.

По построенной матрице IC получилось, что информационное содержание сигнала 7.9910 (максимум - 26.0).

По значениям IC на LOGO видно, что самый сильный сигнал на АТГ и рядом.

Результаты, полученные через LOGO и построение IC согласуются друг с другом. Можно сделать вывод, что найден сигнал, однако сила сигнала не высока.