Практикум 14

Стрица с кодом для практикума №14

1. Использование старт-кодонов (ATG, GTG, TTG)

Во всех трёх организмах наблюдается одинаковая закономерность: ATG является абсолютно доминирующим старт-кодоном, на втором месте — GTG, а TTG используется редко.

Организм (число генов) Старт-кодон Количество генов Процент
Bacillus subtilis (4 279 генов) ATG 3 687 86.2%
GTG 525 12.3%
TTG 67 1.6%
Peptoclostridium acidaminophilum (2 859 генов) ATG 2 521 88.2%
GTG 286 10.0%
TTG 52 1.8%
Ureaplasma parvum (608 генов) ATG 489 80.4%
GTG 111 18.3%
TTG 8 1.3%

Почему используются не только ATG?

  • Регуляция трансляции – менее эффективные старт-кодоны (GTG, TTG) позволяют тонко регулировать уровень экспрессии. Гены «домашнего хозяйства» обычно используют ATG, а гены со слабыми старт-кодонами транслируются реже.
  • Эволюционный компромисс и композиция генома – особенно у бактерий с редуцированным геномом (например, Ureaplasma) стартовый кодон может находиться внутри последовательности другого гена (перекрывающиеся гены).
  • Влияние последовательности Шайна-Дальгарно (SD) – сильная SD может компенсировать слабость альтернативного старт-кодона.
  • Филогенетическая особенность – у фирмикут (Bacillus, Peptoclostridium) частота использования GTG обычно выше, чем у других бактерий.

2. Псевдогены – нефункциональные реликты

Гены, инактивированные мутациями (сдвиг рамки, нонсенс-мутация), классифицируются как псевдогены.

Локус (Locus Tag) Координаты CDS Название гена / продукта Позиция внутр. стоп-кодона Объяснение
BUN98_RS03900 complement (87998..88735) C4-дикарбоксилатный транспортер, мембранная субъединица DcuB 154 (из 245 а.к.) Псевдоген. «frameshifted» — сдвиг рамки, внутренний стоп-кодон.
BUN98_RS09165213796..214527 Цитохром c-биосинтетический протеин 151 (из 243 а.к.) Псевдоген. «incomplete» — нонсенс-мутация, преждевременный стоп.
BUN98_RS09675 complement (228739..229653) Транспортер аминокислот/аминов 95 (из 304 а.к.) Псевдоген. «internal stop», прямая нонсенс-мутация.
BUN98_RS10840 257800..258594 Холин-глицин бетаин-альдегиддегидрогеназа 131 (из 264 а.к.) Псевдоген. «frameshifted» — стоп-кодон в новой рамке.

Зачем бактерии эти последовательности? Эти гены не функциональны – это псевдогены, эволюционные реликты. Они сохраняются в геноме временно, пока не удалятся делецией. Иногда они могут служить резервуаром генетического разнообразия.

3. Стоп-кодоны (TAA, TAG, TGA)

У Ureaplasma parvum наблюдается исключение: стоп-кодон TGA не используется вообще.

Организм Общее число CDS TAA TAG TGA
Bacillus subtilis 4 279 2 203 (51.5%) 505 (11.8%) 1 571 (36.7%)
Peptoclostridium acidaminophilum 2 859 1 661 (58.1%) 446 (15.6%) 752 (26.3%)
Ureaplasma parvum 608 588 (96.7%) 20 (3.3%) 0 (0%)

Куда «пропал» стоп-кодон TGA?

У Ureaplasma parvum (и всего класса Mollicutes) кодон TGA не является стоп-сигналом, а кодирует аминокислоту триптофан (Trp). Это радикальное отклонение от универсального генетического кода.

Научные источники:

  1. Glass, J.I. et al. (2000) The complete sequence of the mucosal pathogen Ureaplasma urealyticum. Nature 407:757-762.
  2. McCutcheon, J.P. & Moran, N.A. (2012) Extreme genome reduction in symbiotic bacteria. Nature Reviews Microbiology 10:13-26.
  3. Oshima, K. et al. (2004) Reductive evolution suggested from the complete genome sequence of a plant-pathogenic phytoplasma. Nature Genetics 36:27-29.
  4. Grosjean, H. et al. (2014) Predicting the minimal translation apparatus: lessons from the reductive evolution of mollicutes. PLoS Genetics 10:e1004363.

4. Координаты в формате join и бактериальный «сплайсинг»

Организм Найденные гены (примеры) Координаты в формате join
Bacillus subtilis Споруляционный белок SpoVR join(330562..330639, 330724..330939)
Bacillus subtilis Фосфоглюкомутаза join(complement(331448..331519), complement(331602..332012))
Peptoclostridium acidaminophilum Белок, ассоциированный со споруляцией join(220625..220696, 220779..221018)
Peptoclostridium acidaminophilum Никель-зависимая гидрогеназа join(complement(543337..543420), complement(543503..544126))

Что означает join?
В формате GenBank/GFF запись join(…) указывает, что кодирующая последовательность (CDS) состоит из нескольких несмежных сегментов, которые объединяются на уровне мРНК в единую рамку считывания.

Есть ли у бактерий сплайсинг?
Классический ядерный сплайсинг (сплайсосомный) у бактерий отсутствует. Однако существуют автокаталитические интроны групп I и II (в основном в тРНК/рРНК), но они крайне редки в мРНК.

Как объяснить наличие join для найденных генов?
Наиболее вероятно — артефакт сборки генома. В сложных участках (повторы) алгоритмы сборки могут разрывать единый ген на несколько контигов, а аннотационный пайплайн (PGAP) интерпретирует фрагменты как «экзоны».