Последовательность Козак - последовательность нуклеотидов в составе молекулы мРНК эукариот, окружающая старт-кодон и необходимая для инициации трансляции.
Была получена позиционная весовая матрица с псевдоотсчетами.
Таблица 1. Позиционная весовая матрица
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | 2.02 | 2.29 | 2.33 | 2.28 | 2.93 | 2.53 | 2.19 | 3.74 | -4.08 | -4.08 | 2.19 | 2.55 | 2.00 |
T | 2.16 | 2.09 | 2.04 | 1.70 | 1.34 | 1.81 | 1.27 | -4.08 | 3.74 | -4.08 | 1.69 | 2.08 | 2.24 |
G | 2.89 | 3.10 | 2.90 | 2.84 | 3.01 | 2.48 | 2.85 | -3.72 | -3.72 | 4.11 | 3.40 | 2.38 | 3.13 |
C | 2.97 | 2.55 | 2.82 | 3.07 | 2.08 | 3.09 | 3.24 | -3.72 | -3.72 | -3.72 | 2.32 | 2.99 | 2.63 |
Рисунок 1. Гистограмма весов
На гистограмме видно, что график отрицательного контроля сдвинут влево по сравнению с остальными графиками. В качестве достоверных, были взяты последовательности, вес которых выше 37. То есть пороговый вес - 37. Далее была построена матрицу результатов проверки.
Таблица 1. Матрица результатов проверки
обучение | контроль(+) | контроль(-) | |
сигнал(+) | 353 (70.6%) | 366 (73.2%) | 129 (25.8%) |
сигнал(-) | 147 (29.4%) | 134 (26.8%) | 371 (74.2%) |
Затем была получена матрица информационного содержания
Таблица 3. Матрица информационного содержания
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | 6.49 | 9.68 | 10.28 | 9.56 | 23.50 | 13.63 | 8.39 | 67.56 | 0.00 | 0.00 | 8.39 | 14.01 | 6.27 |
T | 8.05 | 7.26 | 6.70 | 4.00 | 2.17 | 4.70 | 1.92 | 0.00 | 67.56 | 0.00 | 3.90 | 7.15 | 8.97 |
G | 15.44 | 20.35 | 15.58 | 14.47 | 18.15 | 8.77 | 14.61 | 0.00 | 0.00 | 74.13 | 30.18 | 7.65 | 21.24 |
C | 17.15 | 9.66 | 14.05 | 19.76 | 4.96 | 20.20 | 24.56 | 0.00 | 0.00 | 0.00 | 7.05 | 17.72 | 10.82 |
IC(j) | 47.12 | 46.94 | 46.62 | 47.79 | 48.79 | 47.29 | 49.48 | 67.56 | 67.56 | 74.13 | 49.52 | 46.53 | 47.30 |
С использованием сервиса WebLOGO 3 было построено LOGO.
На представленном лого видно, что старт-кодон консервативен. Однако никакие другие достаточно консервативные участки в этой последовательности выделить не удаётся.