Описание одного сигнала, закодированного в геноме

В данном практикуме я решила исследовать сигнал лактозного промотора. Он состоит в регуляции экспрессии генов лактозного оперона на основе наличия лактозы и отсутствия глюкозы в среде. РНК-полимераза начинает транскрипцию с лактозного промотора, который указывает начальный участок для синтеза мРНК генов метаболизма лактозы. Этот сигнал адресован системе генной регуляции бактерий, особенно ферментам, задействованным в переработке углеводов.
Как это работает? Когда в клетке низкая концентрация глюкозы и высокая концентрация лактозы, репрессор диссоциирует от операторного участка, освобождая промотор. Это позволяет РНК-полимеразе начать транскрипцию генов оперона, что ведет к синтезу необходимых для расщепления лактозы ферментов.

Сигнал варьируется по силе в зависимости от уровней глюкозы и лактозы. Он становится более эффективным при низких уровнях глюкозы, благодаря синтезу цАМФ и взаимодействию с белком CAP, который увеличивает сродство РНК-полимеразы к лактозному промотору, усиливая его активность.

В условиях лабораторных культур, например, когда E. coli выращивают на среде, содержащей исключительно лактозу как источник углерода при ограничении глюкозы, активируется лактозный оперон, что приводит к заметному увеличению метаболической активности и роста бактерий, использующих лактозу.

Использованная литература

1. Основы молекулярной биологии клетки : учебное пособие / Б. Альбертс, К. Хопкин, А. Джонсон [и др.]. - 4-е изд. - Москва : Лаборатория знаний, 2024. - 799 с. - ISBN 978-5-93208-647-6.
2. Гены по Льюину / Дж.Кребс, Э. Голдштейн, С. Килпатрик. Изд. "Лаборатория знаний", 2018

Позиционная весовая матрица (PWM) для последовательности Козак человека

Последовательность Шайна — Дальгарно — сайт связывания рибосом на молекуле мРНК прокариот, обычно на расстоянии около 10 нуклеотидов до стартового кодона AUG.
Для построения позиционно-весовой матрицы (PWM) был использован скрипт, написанный Каримовой Кариной (202 группа) и предоставленный для использования (выражаю ей огромную благодарность!).
Для исследования я выбрала бактерию, по которой писала мини-обзор в первом семестре - Campylobacter coli. Все использованные файлы указаны тут (переменная "FILES"), но вкратце - были взяты последовательность хромосомы, таблица особенностей бактерии. Скриптом мы достали последовательность хромосомы, координаты CDS, координаты участков перед инициаторным кодоном длиной 20 bp (далее - "промотры") и сами последовательности этих промоторов. Обучающая выборка – последовательности длиной 6, которые имеют не больше 1 некомплементарной пары с последовательностью Шайна-Дальгарно. Отрицательным контролем выступили участки CDS +100 нк от стоп-кодона длиной 20 bp.

Далее (то, что использовалось внутри кода):
hits – последовательности из промотеров, которые имеют не больше 1 некомплементарной пары с ШД
ingene – участки CDS +100 нк от стоп-кодона длиной 20 bp (отрицательный контроль)
promoters – последовательности промоторов

Для подсчёта логарифма отношения, чтобы устраненить нулевые частоты, использовались pseudocounts, равные 0.1 для всех букв. По материалам для обучения была построена позционная весовая матрица (PWM):

1
Рис. 1 Позиционная весовая матрица.
Далее был произведён подсчёт весов с помощью PWM для всех 6-меров (promoters, ingene и hits (neg. control)). По полученным данным были построены гистограммы весов:
1
Рис. 2 Гистограмма распределения весов для последовательностей из промоторов, которые имеют не больше 1 некомплементарной пары с ШД (hits)
1
Рис. 3 Гистограмма распределения весов для последовательностей промоторов (promoters)
1
Рис. 4 Гистограмма распределения весов для участков CDS +100 нк от стоп-кодона длиной 20 bp (ingene, отрицательный контроль)
Далее был взят порог весов, равный 3.6. Этот порог хорошо отделяет отрицательный контроль от положительного. Отобранные последовательности:
1
Рис. 5 Результаты проверки находок при пороге 3.6
Было вычислено IC (информационное содержание; оно равняется 8.95, что довольно хорошо для 6-меров), полученный файл я использовала для создания LOGO.
1
Рис. 6 LOGO для последовательности Шайна—Дальгарно в геноме Campylobacter coli