Rho-зависимая терминация
Для задания я выбрала сигнал Rho-зависимой терминации транскрипции бактерий. Rho-белок связывается с С-богатым сайтом - rut-сайт (rho utilization site). Затем он взаимодействует с РНК-полимеразой, вызывая терминацию траснкрипции. Однако в рассматриваемой статье Rho связывает РНКП на ранних стадиях элонгации при помощи кофакторов NusA и NusG, образуя комплекс претерминации (PTC). Образование PTC позволяет Rho непрерывно отбирать зарождающиеся транскрипты для сигнала терминации, который впоследствии удерживает комплекс элонгации в неактивном состоянии до его диссоциации. Терминация транскрипции - один из важнейших биологических процессов, из-за чего сигнал должен быть довольно сильным. "Rho-dependent transcription termination: a revisionist view", "Structural basis of Rho-dependent transcription termination".
![af](./rut.jpeg)
PWM-матрица
Для второго задания я решила выбрать последовательность Козак для человеского генома. Я скачала аннотированную таблицу человеческих генов. С помощью скрипта Влада Начатого, я получила 3 файла:
- Группа обучения (100 последовательностей)
- Группа для теста (300 последовательностей)
- Группа негативного контроля (300 последовательностей)
А так же PWM-матрицу:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.494 | -1.187 | -0.389 | -0.34 | 0.353 | -0.017 | -0.745 | 1.218 | -5.691 | -5.691 | -0.44 | -0.126 | -0.612 |
C | 0.347 | 0.347 | 0.414 | 0.506 | -0.623 | 0.668 | 0.911 | -5.327 | -5.327 | -5.327 | -0.187 | 0.693 | 0.275 |
G | 0.445 | 0.851 | 0.275 | 0.347 | 0.535 | -0.248 | 0.071 | -5.327 | -5.327 | 1.582 | 0.851 | -0.076 | 0.59 |
T | -0.34 | -0.745 | -0.293 | -0.612 | -0.899 | -0.676 | -0.819 | -5.691 | 1.218 | -5.691 | -0.612 | -0.745 | -0.389 |
С помощью этой матрицы я посчитала веса для последовательностей из всех 3 групп и вывела результаты в виде гистограмм. В качестве порога я взяла 4.0
![af](./combined_histograms.png)
Группа обучения | Положительный контроль | Отрицательный контроль | |
---|---|---|---|
Сигнал + | 75 (75%) | 206 (68,7%) | 104 (34,7%) |
Сигнал - | 25 (25%) | 94 (31,3%) | 196 (65,3%) |
Затем я посчитала IC содержание с помощью скрипта Варвары Сафоновой.
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.128 | -0.154 | -0.112 | -0.103 | 0.214 | -0.007 | -0.151 | 1.761 | 0.0 | 0.0 | -0.121 | -0.047 | -0.141 |
C | 0.145 | 0.145 | 0.185 | 0.248 | -0.099 | 0.386 | 0.671 | 0.0 | 0.0 | 0.0 | -0.046 | 0.41 | 0.107 |
G | 0.206 | 0.589 | 0.107 | 0.145 | 0.27 | -0.057 | 0.022 | 0.0 | 0.0 | 2.286 | 0.589 | -0.021 | 0.315 |
T | -0.103 | -0.151 | -0.093 | -0.141 | -0.156 | -0.146 | -0.154 | 0.0 | 1.761 | 0.0 | -0.141 | -0.151 | -0.112 |
Также обучающую выборку я подала на вход WebLogo 3. В результате оказалось, что значимый информационный вес имеют поззиции 5, 7, 8, 9 и 10.
![af](./logo_res.png)