Сигнал лактозного промотора

Лактозный промотор является частью лактозного оперона прокариот, кодирующего гены метаболизма лактозы (рис. 1). Промотор указывает РНК-полимеразе место на ДНК, с которого нужно начинать транскрипцию мРНК этих генов. Особенность лактозного оперона заключается в том, что синтез его генов происходит только в том случае, если клетка испытывает недостаток глюкозы, а в окружающей среде есть лактоза. Если эти условия не выполнены, транскрипция генов заблокирована белком-репрессором, связывающимся с операторным участком, который следует сразу за промоторным и частично перекрывается с сним (рис. 2). Если же в клетке недостаточно глюкозы, но есть лактоза, репрессор диссоциирует (под действием лактозы, попавшей в клетку из окружающей среды) и РНК-полимераза свободно синтезирует гены, кодирующие ферменты для метаболизма лактозы.

На эффективность сигнала также влияет низкое сродство РНК-полимеразы к лактозному промотору (даже в отсутсвтие белка-репрессора). При снижении концентрации глюкозы в клетке происходит синтес цАМФ, которая в комплексе с белком CAP (catabolism activating protein) изменяет конформацию лактозного промотора и повышает его сродство к РНК-полимеразе.

Получается, что эффективность сигнала напрямую зависит от концентрации глюкозы, поэтому сигнал низко эффективен.

Lactose_genes
Рис.1 Лактозный оперон[3]
Lactose_synthesis
Рис.2 Работа лактозного оперона в присутствии лактозы[3]

Источники:

1) Википедия: Лактозный оперон

2) Reznikoff WS. The lactose operon-controlling elements: a complex paradigm. Mol Microbiol. 1992 Sep;6(17):2419-22. doi: 10.1111/j.1365-2958.1992.tb01416.x. PMID: 1328815.

3) The lac operon, Khan academy.

Позиционная весовая матрица (PWM) для последовательности Козак человека

Для построения PWM последовательнсоти Козак человека было выбрано 100 генов из 8 хромосомы человека (GC - 40,16%)[1]. Из них с помощью скрипта меого коллеги, Смирнова Максима, были вырезаны участки в районе старт-кодона ATG (7 нуклеотидов до и 3 после ATG). Полученные последовательности были разделены на 2 выборки: обучение (40 генов) и тест (60 генов). Из фрагметов обучения была построенна позиционная весовая матрица (табл. 1) и IC-матрица (табл. 2).

Табл. 1. PWM
Letter 12345678910111213
A-0.0681-0.8302-0.50750.29960.3593-0.2638-0.50751.2066-3.8748-3.87480.29960.0171-0.5075
T-0.5075-0.3783-0.5075-1.3098-1.6775-1.0416-1.6775-3.87481.2066-3.8748-0.5075-1.6775-1.3098
G0.13500.63490.23760.33070.69840.13500.0205-3.4760 -3.47601.60550.41590.81451.1780
C0.49430.41590.69840.2376-0.43140.81451.0566-3.47760-3.4760-3.4760-0.43140.0206-0.6428

Информационное содержание и Logo последовательности Козак

Матрица информационного содержания для выравнивания из материала обучения: IC.

Итоговое информационное содержание сигнала = 9.1

Logo
Рис.3 Logo последовательности Козак человека

Logo было построено по полученному выравнию в программе WebLogo3. Самый сильный и однозначный сигнал наблюдается в старт-кодоне, в последовательности содержится большое количество GC нуклеотидов.

Литература

1) On the length, weight and GC content of the human genome