Стрица с кодом для практикума №14
Во всех трёх организмах наблюдается одинаковая закономерность: ATG является абсолютно доминирующим старт-кодоном, на втором месте — GTG, а TTG используется редко.
| Организм (число генов) | Старт-кодон | Количество генов | Процент |
|---|---|---|---|
| Bacillus subtilis (4 279 генов) | ATG | 3 687 | 86.2% |
| GTG | 525 | 12.3% | |
| TTG | 67 | 1.6% | |
| Peptoclostridium acidaminophilum (2 859 генов) | ATG | 2 521 | 88.2% |
| GTG | 286 | 10.0% | |
| TTG | 52 | 1.8% | |
| Ureaplasma parvum (608 генов) | ATG | 489 | 80.4% |
| GTG | 111 | 18.3% | |
| TTG | 8 | 1.3% |
Почему используются не только ATG?
• Регуляция трансляции – менее эффективные старт-кодоны (GTG, TTG) позволяют тонко регулировать уровень экспрессии. Гены «домашнего хозяйства» обычно используют ATG, а гены со слабыми старт-кодонами транслируются реже.
• Эволюционный компромисс и композиция генома – особенно у бактерий с редуцированным геномом (например, Ureaplasma) стартовый кодон может находиться внутри последовательности другого гена (перекрывающиеся гены).
• Влияние последовательности Шайна-Дальгарно (SD) – сильная SD может компенсировать слабость альтернативного старт-кодона.
• Филогенетическая особенность – у фирмикут (Bacillus, Peptoclostridium) частота использования GTG обычно выше, чем у других бактерий.
Гены, инактивированные мутациями (сдвиг рамки, нонсенс-мутация), классифицируются как псевдогены.
| Локус (Locus Tag) | Координаты CDS | Название гена / продукта | Позиция внутр. стоп-кодона | Объяснение |
|---|---|---|---|---|
| BUN98_RS03900 | complement (87998..88735) | C4-дикарбоксилатный транспортер, мембранная субъединица DcuB | 154 (из 245 а.к.) | Псевдоген. «frameshifted» — сдвиг рамки, внутренний стоп-кодон. |
| BUN98_RS09165 | 213796..214527 | Цитохром c-биосинтетический протеин | 151 (из 243 а.к.) | Псевдоген. «incomplete» — нонсенс-мутация, преждевременный стоп. |
| BUN98_RS09675 | complement (228739..229653) | Транспортер аминокислот/аминов | 95 (из 304 а.к.) | Псевдоген. «internal stop», прямая нонсенс-мутация. |
| BUN98_RS10840 | 257800..258594 | Холин-глицин бетаин-альдегиддегидрогеназа | 131 (из 264 а.к.) | Псевдоген. «frameshifted» — стоп-кодон в новой рамке. |
Зачем бактерии эти последовательности? Эти гены не функциональны – это псевдогены, эволюционные реликты. Они сохраняются в геноме временно, пока не удалятся делецией. Иногда они могут служить резервуаром генетического разнообразия.
У Ureaplasma parvum наблюдается исключение: стоп-кодон TGA не используется вообще.
| Организм | Общее число CDS | TAA | TAG | TGA |
|---|---|---|---|---|
| Bacillus subtilis | 4 279 | 2 203 (51.5%) | 505 (11.8%) | 1 571 (36.7%) |
| Peptoclostridium acidaminophilum | 2 859 | 1 661 (58.1%) | 446 (15.6%) | 752 (26.3%) |
| Ureaplasma parvum | 608 | 588 (96.7%) | 20 (3.3%) | 0 (0%) |
Куда «пропал» стоп-кодон TGA?
У Ureaplasma parvum (и всего класса Mollicutes) кодон TGA не является стоп-сигналом, а кодирует аминокислоту триптофан (Trp). Это радикальное отклонение от универсального генетического кода.
Научные источники:
join и бактериальный «сплайсинг»| Организм | Найденные гены (примеры) | Координаты в формате join |
|---|---|---|
| Bacillus subtilis | Споруляционный белок SpoVR | join(330562..330639, 330724..330939) |
| Bacillus subtilis | Фосфоглюкомутаза | join(complement(331448..331519), complement(331602..332012)) |
| Peptoclostridium acidaminophilum | Белок, ассоциированный со споруляцией | join(220625..220696, 220779..221018) |
| Peptoclostridium acidaminophilum | Никель-зависимая гидрогеназа | join(complement(543337..543420), complement(543503..544126)) |
Что означает join? В формате GenBank/GFF запись join(…) указывает, что кодирующая последовательность (CDS) состоит из нескольких несмежных сегментов, которые объединяются на уровне мРНК в единую рамку считывания.
Есть ли у бактерий сплайсинг? Классический ядерный сплайсинг (сплайсосомный) у бактерий отсутствует. Однако существуют автокаталитические интроны групп I и II (в основном в тРНК/рРНК), но они крайне редки в мРНК.
Как объяснить наличие join для найденных генов? Наиболее вероятно — артефакт сборки генома. В сложных участках (повторы) алгоритмы сборки могут разрывать единый ген на несколько контигов, а аннотационный пайплайн (PGAP) интерпретирует фрагменты как «экзоны».