Практикум 6

1. Рибопереключатели

Рибопереключатели - мотив в РНК, находящийся в 5"-нетранслируемой области мРНК, способный в зависимости от присутствия целевых веществ (например, глицином или с S-аденозилметионином) подавлять трансляцию гена, перед которым находится. Благодаря своему расположению, рибопереключатель транскрибируется до транслируемой части мРНК, и в активированном состоянии за счёт своей структуры может обрывать транскрипцию, тем самым снижая количество продуктов гена. Рибопереключатели состоят из двух функциональных блоков: чувствительный, с которым связывается целевое вещество, и эффекторный, за счёт которой происходит обрыв транскрипции. Чувствительная часть высокоспецифична и высокочувствительна, что делает рибопереключетели высокоэффективным сигналом. Часто рибопереключатели осуществляют механизм "отрицательной обратной связи": чувствительная асть связывается с веществом, являющимся продуктом реакции, осуществляемой ферментом, на мРНК которого находится переключатель.

2. Построение PWM последовательности Козак

Последовательность Козак - сигнал старта транскрипции ДНК. Для построения позиционно-весовой матрицы был использован скрипт Георгия Муравёва. Скрипт принимает на вход таблицу с генами человека и их координатами. PWM строилась по участкам, состоящим из старт-кодона ATG, 7 нуклеотидов до и 3 нуклеотидов после него. В результате его работы были получены последовательности для обучения,последовательности для тестирования и последовательности для негативного контроля.

letter 1 2 3 4 5 6 7 8 9 10 11 12 13
A -0.40 -0.35 -0.34 -0.19 0.35 0.12 -0.48 1.22 -6.60 -6.60 -0.26 -0.07 -0.61
T -0.32 -0.56 -0.21 -0.85 -1.35 -0.53 -1.35 -6.60 1.22 -6.60 -0.91 -0.39 -0.39
G 0.37 0.61 0.18 0.24 0.56 -0.23 0.33 -6.24 -6.24 1.58 0.86 -0.06 0.66
C 0.35 0.19 0.4 0.59 -0.34 0.48 0.8 -6.24 -6.24 -6.24 -0.19 0.49 0.17

Позиционно-весовая матрица

фото

Гистограмма распределения весов последовательностей

На основе гистограммы в качестве порогового значения был выбран вес 5, так как на гистограмме можно увидеть пик числа последовательностей положительного контроля в этой области. Ниже приведена таблица проверки находок:

Обучение Положительный контроль Отрицательный контроль
Cигнал(+) 306 (61.2%) 272 (54.4%) 71 (14.2%)
Cигнал(-) 194 (38.8%) 228 (45.6%) 429 (85.8%)

Результаты проверки

Информационное содержание

Была получена матрица IC и получено LOGO последовательности

letter 1 2 3 4 5 6 7 8 9 10 11 12 13
A -0.11 -0.10 -0.10 -0.07 0.21 0.06 -0.13 1.76 0.00 0.00 -0.08 -0.03 -0.14
T -0.10 -0.14 -0.07 -0.15 -0.15 -0.13 -0.15 0.00 1.76 0.00 -0.16 -0.11 -0.11
G 0.16 0.33 0.06 0.09 0.29 -0.06 0.13 0.00 0.00 2.29 0.60 -0.02 0.38
C 0.15 0.07 0.18 0.32 -0.07 0.23 0.53 0.00 0.00 0.00 -0.05 0.24 0.06
IC(j) 0.09 0.16 0.06 0.18 0.28 0.10 0.39 1.76 1.76 2.29 0.31 0.08 0.19

фото

LOGO последовательности

4. Подсчёт сайтов

Сайты GAATTC были подсчитаны в референсном геноме Escherichia coli str. K-12 substr. MG1655. Их количество составило 646. С учётом GC-состава и исходя из предположения, что все нуклеотиды в последовательности независимы, ожидаемое число таких последовательностей может быть вычислено как произведение вероятностей появления каждого нуклеотида домноженное на количество нуклеотидов в геноме. Оно составило 1097, что ялвяется статистически важным отличием (p-value = 1.77e-49).

Литература

Narasimhan Sudarsan, Ming C. Hammond, Kirsten F. Block, Rudiger Welz, Jeffrey E. Barrick, Adam Roth, Ronald R. Breaker. Tandem Riboswitch Architectures Exhibit Complex Gene Control Functions // Science. 2006. V. 314. P. 300-304.