Сигналы и мотивы

Краткое описание:

Название: последовательность Шайна-Дальгарно

В чем состоит сигнал: сайт связывания рибосом на молекуле мРНК

Локация: ~в 10 нуклеотидах от старт-кодона AUG

Функция: обеспечить начало трансляции с правильного старт-кодона

Сила: высокоэффективен, так как обеспечивает связывание рибосом в молекуле мРНК

PWM для последовательноти Шайна-Дальгарно Bacillus subtilis (AGGAGG)

Использовала скрипт, полученный в наследство от старшекурсников и с его помощью нашла последовательности 20 пн до старт-кодона. Потом из нее выбрала последовательности длины 6 с не более чем 1 несовпадающей парой с Ш-Д.

По этой выборке была построена PWM c pseudocount = 0.1 для азотистых оснований.

базовые частоты 1 2 3 4 5 6
A 0.282 1.087 -1.616 -1.805 1.146 -1.636 -0.941
T 0.283 -1.428 -2.269 -3.267 -2.278 -2.145 -1.357
G 0.217 -1.204 1.426 1.455 -1.142 1.425 1.273
C 0.218 -1.962 -2.932 -2.842 -2.719 -3.114 -1.648

Для всех 6-меров посчитала веса по полученной PWM

Рис 1. Гистограмма весов в обучающей выборке

Рис 2. Гистограмма весов в тестовой выборке

Рис 3. Гистограмма весов в негативной выборке

На основе весов выбрала порог 2.5 и посчитала количество 6-меров, которые, предположительно, являются искомым сигналом.

обучающая выборка тестовая выборка негативная сигнал(+) 3625 4744 611 сигнал(-) 0 60731 64879

IC выравнивания равно 8.1 из 12, довольно большое для последовательности из 6 нуклеотидов.

Построила LOGO этого сигнала:

Рис 4. Лого для последовательности Шайна-Дальгарно

Все выборки хорошо разделились, лого получлось достоверное, так что все хорошо.