Рибопереключатели - мотив в РНК, находящийся в 5"-нетранслируемой области мРНК, способный в зависимости от присутствия целевых веществ (например, глицином или с S-аденозилметионином) подавлять трансляцию гена, перед которым находится. Благодаря своему расположению, рибопереключатель транскрибируется до транслируемой части мРНК, и в активированном состоянии за счёт своей структуры может обрывать транскрипцию, тем самым снижая количество продуктов гена. Рибопереключатели состоят из двух функциональных блоков: чувствительный, с которым связывается целевое вещество, и эффекторный, за счёт которой происходит обрыв транскрипции. Чувствительная часть высокоспецифична и высокочувствительна, что делает рибопереключетели высокоэффективным сигналом. Часто рибопереключатели осуществляют механизм "отрицательной обратной связи": чувствительная асть связывается с веществом, являющимся продуктом реакции, осуществляемой ферментом, на мРНК которого находится переключатель.
Последовательность Козак - сигнал старта транскрипции ДНК. Для построения позиционно-весовой матрицы был использован скрипт Георгия Муравёва. Скрипт принимает на вход таблицу с генами человека и их координатами. PWM строилась по участкам, состоящим из старт-кодона ATG, 7 нуклеотидов до и 3 нуклеотидов после него. В результате его работы были получены последовательности для обучения,последовательности для тестирования и последовательности для негативного контроля.
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.40 | -0.35 | -0.34 | -0.19 | 0.35 | 0.12 | -0.48 | 1.22 | -6.60 | -6.60 | -0.26 | -0.07 | -0.61 |
T | -0.32 | -0.56 | -0.21 | -0.85 | -1.35 | -0.53 | -1.35 | -6.60 | 1.22 | -6.60 | -0.91 | -0.39 | -0.39 |
G | 0.37 | 0.61 | 0.18 | 0.24 | 0.56 | -0.23 | 0.33 | -6.24 | -6.24 | 1.58 | 0.86 | -0.06 | 0.66 |
C | 0.35 | 0.19 | 0.4 | 0.59 | -0.34 | 0.48 | 0.8 | -6.24 | -6.24 | -6.24 | -0.19 | 0.49 | 0.17 |
Позиционно-весовая матрица
Гистограмма распределения весов последовательностей
На основе гистограммы в качестве порогового значения был выбран вес 5, так как на гистограмме можно увидеть пик числа последовательностей положительного контроля в этой области. Ниже приведена таблица проверки находок:
Обучение | Положительный контроль | Отрицательный контроль | |
---|---|---|---|
Cигнал(+) | 306 (61.2%) | 272 (54.4%) | 71 (14.2%) |
Cигнал(-) | 194 (38.8%) | 228 (45.6%) | 429 (85.8%) |
Результаты проверки
Была получена матрица IC и получено LOGO последовательности
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.11 | -0.10 | -0.10 | -0.07 | 0.21 | 0.06 | -0.13 | 1.76 | 0.00 | 0.00 | -0.08 | -0.03 | -0.14 |
T | -0.10 | -0.14 | -0.07 | -0.15 | -0.15 | -0.13 | -0.15 | 0.00 | 1.76 | 0.00 | -0.16 | -0.11 | -0.11 |
G | 0.16 | 0.33 | 0.06 | 0.09 | 0.29 | -0.06 | 0.13 | 0.00 | 0.00 | 2.29 | 0.60 | -0.02 | 0.38 |
C | 0.15 | 0.07 | 0.18 | 0.32 | -0.07 | 0.23 | 0.53 | 0.00 | 0.00 | 0.00 | -0.05 | 0.24 | 0.06 |
IC(j) | 0.09 | 0.16 | 0.06 | 0.18 | 0.28 | 0.10 | 0.39 | 1.76 | 1.76 | 2.29 | 0.31 | 0.08 | 0.19 |
LOGO последовательности
Сайты GAATTC были подсчитаны в референсном геноме Escherichia coli str. K-12 substr. MG1655. Их количество составило 646. С учётом GC-состава и исходя из предположения, что все нуклеотиды в последовательности независимы, ожидаемое число таких последовательностей может быть вычислено как произведение вероятностей появления каждого нуклеотида домноженное на количество нуклеотидов в геноме. Оно составило 1097, что ялвяется статистически важным отличием (p-value = 1.77e-49).
Narasimhan Sudarsan, Ming C. Hammond, Kirsten F. Block, Rudiger Welz, Jeffrey E. Barrick, Adam Roth, Ronald R. Breaker. Tandem Riboswitch Architectures Exhibit Complex Gene Control Functions // Science. 2006. V. 314. P. 300-304.