В данном практикуме я решила исследовать сигнал лактозного промотора. Он состоит в регуляции экспрессии генов лактозного оперона на основе наличия лактозы и
отсутствия глюкозы в среде. РНК-полимераза начинает транскрипцию с лактозного промотора, который указывает начальный участок для синтеза мРНК генов
метаболизма лактозы. Этот сигнал адресован системе генной регуляции бактерий, особенно ферментам, задействованным в переработке углеводов.
Как это работает? Когда в клетке низкая концентрация глюкозы и высокая концентрация лактозы, репрессор диссоциирует от операторного участка, освобождая
промотор. Это позволяет РНК-полимеразе начать транскрипцию генов оперона, что ведет к синтезу необходимых для расщепления лактозы ферментов.
Сигнал варьируется по силе в зависимости от уровней глюкозы и лактозы. Он становится более эффективным при низких уровнях глюкозы, благодаря синтезу цАМФ и
взаимодействию с белком CAP, который увеличивает сродство РНК-полимеразы к лактозному промотору, усиливая его активность.
В условиях лабораторных культур, например, когда E. coli выращивают на среде, содержащей исключительно лактозу как источник углерода при ограничении глюкозы, активируется лактозный
оперон, что приводит к заметному увеличению метаболической активности и роста бактерий, использующих лактозу.
1. Основы молекулярной биологии клетки : учебное пособие / Б. Альбертс, К. Хопкин, А. Джонсон [и др.]. - 4-е изд. - Москва : Лаборатория знаний, 2024. - 799 с. -
ISBN 978-5-93208-647-6.
2. Гены по Льюину / Дж.Кребс, Э. Голдштейн, С. Килпатрик. Изд. "Лаборатория знаний", 2018
Последовательность Шайна — Дальгарно — сайт связывания рибосом на молекуле мРНК прокариот, обычно на расстоянии около 10 нуклеотидов до стартового кодона AUG.
Для построения позиционно-весовой матрицы (PWM) был использован скрипт, написанный Каримовой Кариной (202 группа) и предоставленный для использования (выражаю ей огромную благодарность!).
Для исследования я выбрала бактерию, по которой писала мини-обзор в первом семестре - Campylobacter coli. Все использованные файлы указаны
тут (переменная "FILES"), но вкратце - были взяты последовательность хромосомы,
таблица особенностей бактерии. Скриптом мы достали последовательность хромосомы, координаты CDS, координаты участков перед инициаторным кодоном длиной 20 bp (далее - "промотры") и сами последовательности этих промоторов.
Обучающая выборка – последовательности длиной 6, которые имеют не больше 1 некомплементарной пары с последовательностью Шайна-Дальгарно. Отрицательным контролем выступили участки CDS +100 нк от стоп-кодона длиной 20 bp.
Далее (то, что использовалось внутри кода):
hits – последовательности из промотеров, которые имеют не больше 1 некомплементарной пары с ШД
ingene – участки CDS +100 нк от стоп-кодона длиной 20 bp (отрицательный контроль)
promoters – последовательности промоторов
Для подсчёта логарифма отношения, чтобы устраненить нулевые частоты, использовались pseudocounts, равные 0.1 для всех букв. По материалам для обучения была построена позционная весовая матрица (PWM):