Лактозный промотор является частью лактозного оперона прокариот, кодирующего гены метаболизма лактозы (рис. 1). Промотор указывает РНК-полимеразе место на ДНК, с которого нужно начинать транскрипцию мРНК этих генов. Особенность лактозного оперона заключается в том, что синтез его генов происходит только в том случае, если клетка испытывает недостаток глюкозы, а в окружающей среде есть лактоза. Если эти условия не выполнены, транскрипция генов заблокирована белком-репрессором, связывающимся с операторным участком, который следует сразу за промоторным и частично перекрывается с сним (рис. 2). Если же в клетке недостаточно глюкозы, но есть лактоза, репрессор диссоциирует (под действием лактозы, попавшей в клетку из окружающей среды) и РНК-полимераза свободно синтезирует гены, кодирующие ферменты для метаболизма лактозы.
На эффективность сигнала также влияет низкое сродство РНК-полимеразы к лактозному промотору (даже в отсутсвтие белка-репрессора). При снижении концентрации глюкозы в клетке происходит синтес цАМФ, которая в комплексе с белком CAP (catabolism activating protein) изменяет конформацию лактозного промотора и повышает его сродство к РНК-полимеразе.
Получается, что эффективность сигнала напрямую зависит от концентрации глюкозы, поэтому сигнал низко эффективен.
1) Википедия: Лактозный оперон
2) Reznikoff WS. The lactose operon-controlling elements: a complex paradigm. Mol Microbiol. 1992 Sep;6(17):2419-22. doi: 10.1111/j.1365-2958.1992.tb01416.x. PMID: 1328815.
3) The lac operon, Khan academy.
Для построения PWM последовательнсоти Козак человека было выбрано 100 генов из 8 хромосомы человека (GC - 40,16%)[1]. Из них с помощью скрипта меого коллеги, Смирнова Максима, были вырезаны участки в районе старт-кодона ATG (7 нуклеотидов до и 3 после ATG). Полученные последовательности были разделены на 2 выборки: обучение (40 генов) и тест (60 генов). Из фрагметов обучения была построенна позиционная весовая матрица (табл. 1) и IC-матрица (табл. 2).
Letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.0681 | -0.8302 | -0.5075 | 0.2996 | 0.3593 | -0.2638 | -0.5075 | 1.2066 | -3.8748 | -3.8748 | 0.2996 | 0.0171 | -0.5075 |
T | -0.5075 | -0.3783 | -0.5075 | -1.3098 | -1.6775 | -1.0416 | -1.6775 | -3.8748 | 1.2066 | -3.8748 | -0.5075 | -1.6775 | -1.3098 |
G | 0.1350 | 0.6349 | 0.2376 | 0.3307 | 0.6984 | 0.1350 | 0.0205 | -3.4760 | -3.4760 | 1.6055 | 0.4159 | 0.8145 | 1.1780 |
C | 0.4943 | 0.4159 | 0.6984 | 0.2376 | -0.4314 | 0.8145 | 1.0566 | -3.47760 | -3.4760 | -3.4760 | -0.4314 | 0.0206 | -0.6428 |
Матрица информационного содержания для выравнивания из материала обучения: IC.
Итоговое информационное содержание сигнала = 9.1
Logo было построено по полученному выравнию в программе WebLogo3. Самый сильный и однозначный сигнал наблюдается в старт-кодоне, в последовательности содержится большое количество GC нуклеотидов.