Инициация трансляции обуславливается факторами инициации IF-1, IF-2 и IF-3. Фактор IF-3 не дает возможности 30S субъединиц реассоциировать с 50S субъединицей поскольку это подавляет инициацию. Вместе с этим он способствует взаимодействию 16S РНК с мРНК. Фактор IF-2 имеет ГТФазную активность, связывается с инициативной тРНК, которая несет формилметионин и контролирует ее связывание с Р-сайтом на 30S субъединице. Он также обеспечивает ассоциацию 50S субъединицы с 30S мРНК-тРНК(fmet) комплексом и последующее высвобождение всех факторов инициации. Процесс требует энергии и акитвность IF2 зависит от ГТФазной активности рибосомы. Этот этап инициации представляет собой единственный момент когда первая аминоацилированная тРНК связывается с Р-сайтом. Для того, чтобы сделать А-сайт недоступным для присоединения первой тРНК он блокируется IF1.
Выражаем огромную блягодарность Максиму Смирнову, скрипт которого был использован для выволнения этого задания. Скрипт выбирает 100 случайных геннов человека и вырезает 7 нуклеотидов до старта трансляции ATG + ATG + 3 нук. после ATG. Результат: обучение для 40, тест для 60.
N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | -2,3 | -0,37 | -0,65 | 0,11 | -0,82 | -0,50 | -0,82 | 1,22 | -4,08 | -4,08 | -0,37 | -0,50 | -1,31 |
T | 0,37 | -0,50 | -1,31 | -0,37 | -1,31 | -0,82 | -1,68 | -4,08 | 1,22 | -4,08 | -1,04 | -1,04 | -0,82 |
G | 0,31 | 0,31 | 0,74 | 0,11 | 0,85 | 0,54 | 0,11 | -3,72 | -3,72 | 1,58 | 0,99 | 0,39 | 0,94 |
C | 0,31 | 0,54 | 0,54 | 0,21 | 0,47 | 0,54 | 1,08 | -3,72 | -3,72 | -3,72 | -0,28 | 0,74 | 0,31 |
Для положительного контроля использовались последовательности из тестового файла, для отрицательного использовались последовательности содержащие ATG. С помощью скрипта были получены positive control mean score: 5.242721611434907, negative control mean score: 1.4154491969956562, p-value: 1.1611820424312292e-11 и ic:9.784051189548972. Файл с данными. Поскольку positive control больше чем negative control, то мы можем сказать, что стартовый кодон Козак специфичен.
Для вычисления информационного содержания последовательности Козак была построена матрица информационного содержания.
N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | -0.10 | -0.11 | -0.14 | 0.05 | -0.15 | -0.13 | -0.15 | 1.78 | 0 | 0 | -0.11 | -0.13 | -0.15 |
T | 0.23 | -0.13 | -0.15 | -0.11 | -0.15 | -0.15 | -0.13 | 0 | 1.78 | 0 | -0.16 | -0.16 | -0.15 |
G | 0.13 | 0.13 | 0.46 | 0.04 | 0.59 | 0.28 | 0.04 | 0 | 0 | 2.30 | 0.80 | 0.17 | 0.73 |
C | 0.13 | 0.28 | 0.28 | 0.08 | 0.23 | 0.28 | 0.94 | 0 | 0 | 0 | -0.06 | 0.46 | 0.13 |
При помощи сервиса WebLOGO 3 было визуализировано информационное содержание(Рис.1).