Краткое описание:
Название: последовательность Шайна-Дальгарно
В чем состоит сигнал: сайт связывания рибосом на молекуле мРНК
Локация: ~в 10 нуклеотидах от старт-кодона AUG
Функция: обеспечить начало трансляции с правильного старт-кодона
Сила: высокоэффективен, так как обеспечивает связывание рибосом в молекуле мРНК
PWM для последовательноти Шайна-Дальгарно Bacillus subtilis (AGGAGG)
Использовала скрипт, полученный в наследство от старшекурсников и с его помощью нашла последовательности 20 пн до старт-кодона. Потом из нее выбрала последовательности длины 6 с не более чем 1 несовпадающей парой с Ш-Д.
По этой выборке была построена PWM c pseudocount = 0.1 для азотистых оснований.
базовые частоты | 1 | 2 | 3 | 4 | 5 | 6 | |
---|---|---|---|---|---|---|---|
A | 0.282 | 1.087 | -1.616 | -1.805 | 1.146 | -1.636 | -0.941 |
T | 0.283 | -1.428 | -2.269 | -3.267 | -2.278 | -2.145 | -1.357 |
G | 0.217 | -1.204 | 1.426 | 1.455 | -1.142 | 1.425 | 1.273 |
C | 0.218 | -1.962 | -2.932 | -2.842 | -2.719 | -3.114 | -1.648 |
Для всех 6-меров посчитала веса по полученной PWM
Рис 1. Гистограмма весов в обучающей выборке
Рис 2. Гистограмма весов в тестовой выборке
Рис 3. Гистограмма весов в негативной выборке
На основе весов выбрала порог 2.5 и посчитала количество 6-меров, которые, предположительно, являются искомым сигналом.
IC выравнивания равно 8.1 из 12, довольно большое для последовательности из 6 нуклеотидов.
Построила LOGO этого сигнала:
Рис 4. Лого для последовательности Шайна-Дальгарно
Все выборки хорошо разделились, лого получлось достоверное, так что все хорошо.