Практикум 8

Последовательность Козак - последовательность нуклеотидов в составе молекулы мРНК эукариот, окружающая старт-кодон и необходимая для инициации трансляции.

Была получена позиционная весовая матрица с псевдоотсчетами.

Таблица 1. Позиционная весовая матрица

letter 1 2 3 4 5 6 7 8 9 10 11 12 13
A 2.02 2.29 2.33 2.28 2.93 2.53 2.19 3.74 -4.08 -4.08 2.19 2.55 2.00
T 2.16 2.09 2.04 1.70 1.34 1.81 1.27 -4.08 3.74 -4.08 1.69 2.08 2.24
G 2.89 3.10 2.90 2.84 3.01 2.48 2.85 -3.72 -3.72 4.11 3.40 2.38 3.13
C 2.97 2.55 2.82 3.07 2.08 3.09 3.24 -3.72 -3.72 -3.72 2.32 2.99 2.63

Рисунок 1. Гистограмма весов

На гистограмме видно, что график отрицательного контроля сдвинут влево по сравнению с остальными графиками. В качестве достоверных, были взяты последовательности, вес которых выше 37. То есть пороговый вес - 37. Далее была построена матрицу результатов проверки.

Таблица 1. Матрица результатов проверки

обучение контроль(+) контроль(-)
сигнал(+) 353 (70.6%) 366 (73.2%) 129 (25.8%)
сигнал(-) 147 (29.4%) 134 (26.8%) 371 (74.2%)

Затем была получена матрица информационного содержания

Таблица 3. Матрица информационного содержания

letter 1 2 3 4 5 6 7 8 9 10 11 12 13
A 6.49 9.68 10.28 9.56 23.50 13.63 8.39 67.56 0.00 0.00 8.39 14.01 6.27
T 8.05 7.26 6.70 4.00 2.17 4.70 1.92 0.00 67.56 0.00 3.90 7.15 8.97
G 15.44 20.35 15.58 14.47 18.15 8.77 14.61 0.00 0.00 74.13 30.18 7.65 21.24
C 17.15 9.66 14.05 19.76 4.96 20.20 24.56 0.00 0.00 0.00 7.05 17.72 10.82
IC(j) 47.12 46.94 46.62 47.79 48.79 47.29 49.48 67.56 67.56 74.13 49.52 46.53 47.30

С использованием сервиса WebLOGO 3 было построено LOGO.

На представленном лого видно, что старт-кодон консервативен. Однако никакие другие достаточно консервативные участки в этой последовательности выделить не удаётся.