Практикум 8

Описание сигнала

Название сигнала: Последовательность Шайна–Дальгарно (SD) — это консервативный регуляторный элемент в мРНК бактерий и архей, обеспечивающий связывание рибосомы с матрицей.
Носитель сигнала: Молекула мРНК прокариот. Сигнал представлен короткой нуклеотидной последовательностью, расположенной в 5'-нетранслируемой области перед стартовым кодоном AUG.
Кому адресован: Малая субъединица рибосомы (30S у бактерий). Анти-SD-последовательность на 3'-конце 16S рРНК рибосомы комплементарна SD-сайту.
Предназначение: Обеспечить точное связывание рибосомы с мРНК и позиционирование стартового кодона в P-сайте. Это необходимо для инициации трансляции, регуляции уровня экспрессии генов (сила взаимодействия SD-анти-SD влияет на эффективность трансляции), независимой инициации трансляции в полицистронных мРНК.
Сила сигнала определяется:
Степенью комплементарности с анти-SD-последовательностью 16S рРНК;
Расстоянием до стартового кодона (5–8 нуклеотидов);
Отсутствием вторичных структур в 5'-UTR, которые могут блокировать доступ к SD-сайту.
Мутации в SD-сайте снижают трансляцию в 10–100 раз.
Из вышеперечисленных данных можно сделать вывод, что сигнал обладает высокой эффективностью.
С эффективностью также связаны белки RsmA/CsrA (и их гомологи, такие как RsmE). Они участвуют в регуляции трансляции через связывание с малими РНК (sRNA), которые имеют повторяющиеся GGA мотивы. Эти мотивы часто локализуются в структурах петли или между стеблями в структуре stem-loop мРНК. Такие мотивы GGA в 5' нетранслируемом участке мРНК, например у hcnA гена, перекрываются с SD последовательностью. Это препятствует связыванию рибосомы с мРНК и ингибирует начало трансляции. Таким образом, белки RsmA и RsmE блокируют доступ рибосомы к SD-последовательности. Это снижает или полностью блокирует инициацию трансляции на этой мРНК. Малая РНК (например, RsmY) с многочисленными GGA мотивами может освобождать мРНК от этого регуляторного блока, улучшая доступ рибосомы к SD-последовательности, тем самым снимая репрессии и способствуя трансляции.
Примеры сигнала:
1. В геноме E. coli:
Каноническая последовательность — AGGAGGU
2. В экспрессионных векторах используется SD-сайт гена 10 бактериофага T7 для усиления трансляции.
3. У цианобактерии Nostoc sp.: SD-мотив GGAGG с вариациями в позициях.
4. В полицистронных мРНК: перед каждым ORF расположены отдельные SD-последовательности (например, GGAGGA перед ORF1, ORF2 и ORF3).

Ссылки на литературу:

  • Flow-seq-метод: особенности и применение в изучении бактериальной трансляции. DOI: 10.32607/actanaturae.11820

  • Лекционные материалы НГУ: роль в инициации трансляции

  • Conformational Dynamics within the Ribosome. J. Stephen Lodmell and Scott P. Hennelly.

  • Рис.1.Особенности строения мРНК у бактерий. 5’- и 3’-UTR, 5’- и 3’-нетранслируемые области соответственно. RBS – сайт посадки рибосомы. ORF – открытая рамка считывания, содержащая белоккодирующую последовательность. SD и анти SD – последовательности Шайна–Дальгарно и анти-Шайна–Дальгарно соответственно. Источник: DOI: 10.32607/actanaturae.11820
    Рис.2.Репрезентативная структура комплекса между белком RsmE и 12-нуклеотидным фрагментом мРНК hcnA, который содержит самый дальний из пяти мотивов GGA и охватывает последовательность SD. Источник: doi:10.1111/j.1365-2958.2007.06042.x

    Сервисы для поиска выбранного сигнала

    Как таковых сервисов для поиска последовательностей Шайна-Далгарно к сожалению найти не удалось :(

    1) ProPr: Prokaryote Promoter Prediction v2.0
    Веб-сервер для предсказания промоторных элементов и регулонов прокариот

    Алгоритм: Первым шагом PePPER all-in-one является отбор набора генов, которые предположительно принадлежат к определенному регулятору в одном организме (целевом; в рамке I представлены все гены целевого организма), путем сравнения с соответствующими регуляторами во всех других организмах (исходных) с помощью белкового Blast (гены в рамке Ia). Параллельно с этим известные TFBS этих регулонов используются для поиска генов в целевом организме, которые несут этот мотив ДНК в своих апстрим регионах (гены во врезке Ib). Затем проводится MEME-поиск в регионах верхнего течения генов в обоих независимо полученных пулах генов. В результате получается набор генов, представляющий предполагаемый регулон в целевом организме с его предсказанными TFBS (гены в блоке II). Наконец, добавляются такие характеристики, как RBSs, промотор и терминаторы транскрипции, после чего результат представляется в графическом виде. Информация может быть доступна и просмотрена отдельно по каждому гену.

    Рис.3.Алгоритм работы ProPr

    В выдаче получаем таблицы с последовательностями промоторов, терминаторов и их координат, а также номера хромосом

    Рис.4.Структура генома Lactococcus lactis subsp, полученная с помощью ProPr.
    Рис.5.Таблица с информацией о полученных промоторных областях.

    Однако, этот сервис ищет именно промоторные последовательности все какие есть, а не целенаправленно последовательность Шайна-Дальгарно.

  • Мануал ProPr

  • Ссылка на таблицу результатов.
  • 2) uorf4u
    Биоинформационный инструмент для аннотации консервативных up-stream ORF.

  • Ссылка на мануал программы uorf4u
  • Алгоритм: Самый простой входной файл - это заданный пользователем номер доступа к белку в NCBI RefSeq, но также это может быть список гомологов (список номеров доступа RefSeq) или файл последовательностей в формате FASTA. В зависимости от исходных данных uORF4u состоит из нескольких этапов: поиск гомологов по базе данных RefSeq с помощью BlastP [запись промежуточных результатов (синие стрелки) в выходной файл], поиск последовательности выше по течению с записью результатов в выходной файл FASTA, аннотация ORF, и, наконец, анализ сохранности и визуализация результатов. ORF определяется как область между стартовым кодоном (могут быть включены и альтернативные стартовые кодоны) и стоп-кодоном, расположенным down-stream. Минимальная длина, установленная по умолчанию, составляет девять нуклеотидов (три кодона). Для прокариот этот шаг также включает поиск последовательности Шайна-Дальгарно (SD) в 20-нуклеотидном окне перед стартовым кодоном. Аннотация SD-последовательности основана на расчете свободной энергии Гиббса SD-антиSD взаимодействия.

    Опять же она аннотирует, но не ищет послдовательность Шайна-Дальгарно.

    Рис.6. Форма для запроса для поиска аннотации uorf4u.
    Рис.7.Схема алгорита работы uorf4u.

    3) FIMO (Find Individual Motif Occurrences)
    FIMO сканирует набор последовательностей в поисках индивидуальных совпадений с каждым из предоставленных вами мотивов.

    Алгоритм: Программа ищет в наборе последовательностей вхождения известных мотивов, рассматривая каждый мотив независимо. Мотивы должны быть в формате MEME Motif Format. Веб-версия FIMO также позволяет вводить мотивы в дополнительных форматах.

    Рис.8. Форма для запроса для поиска мотивов FIMO.

    Авторы отчета:
    Аристов Иван
    Джолос Ксения
    Чистякова Екатерина