Сигналы и мотивы

Описание сигнала

Инициация трансляции обуславливается факторами инициации IF-1, IF-2 и IF-3. Фактор IF-3 не дает возможности 30S субъединиц реассоциировать с 50S субъединицей поскольку это подавляет инициацию. Вместе с этим он способствует взаимодействию 16S РНК с мРНК. Фактор IF-2 имеет ГТФазную активность, связывается с инициативной тРНК, которая несет формилметионин и контролирует ее связывание с Р-сайтом на 30S субъединице. Он также обеспечивает ассоциацию 50S субъединицы с 30S мРНК-тРНК(fmet) комплексом и последующее высвобождение всех факторов инициации. Процесс требует энергии и акитвность IF2 зависит от ГТФазной активности рибосомы. Этот этап инициации представляет собой единственный момент когда первая аминоацилированная тРНК связывается с Р-сайтом. Для того, чтобы сделать А-сайт недоступным для присоединения первой тРНК он блокируется IF1.

Позиционная матрица весов последовательности Козак человека

Выражаем огромную блягодарность Максиму Смирнову, скрипт которого был использован для выволнения этого задания. Скрипт выбирает 100 случайных геннов человека и вырезает 7 нуклеотидов до старта трансляции ATG + ATG + 3 нук. после ATG. Результат: обучение для 40, тест для 60.


N 1 2 3 4 5 6 7 8 9 10 11 12 13
A -2,3 -0,37 -0,65 0,11 -0,82 -0,50 -0,82 1,22 -4,08 -4,08 -0,37 -0,50 -1,31
T 0,37 -0,50 -1,31 -0,37 -1,31 -0,82 -1,68 -4,08 1,22 -4,08 -1,04 -1,04 -0,82
G 0,31 0,31 0,74 0,11 0,85 0,54 0,11 -3,72 -3,72 1,58 0,99 0,39 0,94
C 0,31 0,54 0,54 0,21 0,47 0,54 1,08 -3,72 -3,72 -3,72 -0,28 0,74 0,31

Для положительного контроля использовались последовательности из тестового файла, для отрицательного использовались последовательности содержащие ATG. С помощью скрипта были получены positive control mean score: 5.242721611434907, negative control mean score: 1.4154491969956562, p-value: 1.1611820424312292e-11 и ic:9.784051189548972. Файл с данными. Поскольку positive control больше чем negative control, то мы можем сказать, что стартовый кодон Козак специфичен.

LOGO

Для вычисления информационного содержания последовательности Козак была построена матрица информационного содержания.

N 1 2 3 4 5 6 7 8 9 10 11 12 13
A -0.10 -0.11 -0.14 0.05 -0.15 -0.13 -0.15 1.78 0 0 -0.11 -0.13 -0.15
T 0.23 -0.13 -0.15 -0.11 -0.15 -0.15 -0.13 0 1.78 0 -0.16 -0.16 -0.15
G 0.13 0.13 0.46 0.04 0.59 0.28 0.04 0 0 2.30 0.80 0.17 0.73
C 0.13 0.28 0.28 0.08 0.23 0.28 0.94 0 0 0 -0.06 0.46 0.13

При помощи сервиса WebLOGO 3 было визуализировано информационное содержание(Рис.1).

Рис. 1