Rho-зависимая терминация

Для задания я выбрала сигнал Rho-зависимой терминации транскрипции бактерий. Rho-белок связывается с С-богатым сайтом - rut-сайт (rho utilization site). Затем он взаимодействует с РНК-полимеразой, вызывая терминацию траснкрипции. Однако в рассматриваемой статье Rho связывает РНКП на ранних стадиях элонгации при помощи кофакторов NusA и NusG, образуя комплекс претерминации (PTC). Образование PTC позволяет Rho непрерывно отбирать зарождающиеся транскрипты для сигнала терминации, который впоследствии удерживает комплекс элонгации в неактивном состоянии до его диссоциации. Терминация транскрипции - один из важнейших биологических процессов, из-за чего сигнал должен быть довольно сильным. "Rho-dependent transcription termination: a revisionist view", "Structural basis of Rho-dependent transcription termination".

af
Рис.1 Схема терминации

PWM-матрица

Для второго задания я решила выбрать последовательность Козак для человеского генома. Я скачала аннотированную таблицу человеческих генов. С помощью скрипта Влада Начатого, я получила 3 файла:

А так же PWM-матрицу:

1 2 3 4 5 6 7 8 9 10 11 12 13
A -0.494 -1.187 -0.389 -0.34 0.353 -0.017 -0.745 1.218 -5.691 -5.691 -0.44 -0.126 -0.612
C 0.347 0.347 0.414 0.506 -0.623 0.668 0.911 -5.327 -5.327 -5.327 -0.187 0.693 0.275
G 0.445 0.851 0.275 0.347 0.535 -0.248 0.071 -5.327 -5.327 1.582 0.851 -0.076 0.59
T -0.34 -0.745 -0.293 -0.612 -0.899 -0.676 -0.819 -5.691 1.218 -5.691 -0.612 -0.745 -0.389
Табл.1 PWM-матрица

С помощью этой матрицы я посчитала веса для последовательностей из всех 3 групп и вывела результаты в виде гистограмм. В качестве порога я взяла 4.0

af
Рис.2 Веса последовательности
Группа обучения Положительный контроль Отрицательный контроль
Сигнал + 75 (75%) 206 (68,7%) 104 (34,7%)
Сигнал - 25 (25%) 94 (31,3%) 196 (65,3%)
Табл.2 Количество прошедших порог последовательностей

Затем я посчитала IC содержание с помощью скрипта Варвары Сафоновой.

1 2 3 4 5 6 7 8 9 10 11 12 13
A -0.128 -0.154 -0.112 -0.103 0.214 -0.007 -0.151 1.761 0.0 0.0 -0.121 -0.047 -0.141
C 0.145 0.145 0.185 0.248 -0.099 0.386 0.671 0.0 0.0 0.0 -0.046 0.41 0.107
G 0.206 0.589 0.107 0.145 0.27 -0.057 0.022 0.0 0.0 2.286 0.589 -0.021 0.315
T -0.103 -0.151 -0.093 -0.141 -0.156 -0.146 -0.154 0.0 1.761 0.0 -0.141 -0.151 -0.112
Табл. 3 Матрица информационного содержания.

Также обучающую выборку я подала на вход WebLogo 3. В результате оказалось, что значимый информационный вес имеют поззиции 5, 7, 8, 9 и 10.

af
Рис.3 IC обучающей группы