Мини-обзор особенностей генома бактерии
Clostridium botulinum A str. ATCC 3502

Дьячков Т. А.

Студент первого курса ФББ МГУ

🧬 Аннотация: В этом обзоре проанализирована структура генома Clostridium botulinum A str. ATCC 3502: длины белков, их распределение по геному, нуклеотидный состав. Описаны инструменты анализа и биологическое значение бактерии.

📌 Введение

Бактерия Clostridium botulinum A str. ATCC 3502 относится к царству Bacillati, типу Bacillota, классу Clostridia, порядку Eubacteriales, семейству Clostridiaceae, роду Clostridium. Clostridium botulinum – грамположительные палочковидные анаэробные спорообразующие подвижные бактерии. Таксономическим признаком является способность синтезировать ботулинический нейротоксин (ботулотоксин), вызывающий ботулизм [1].

Ботулизм встречается во всех странах мира в виде спорадических случаев или вспышек. Человек заражается при употреблении консервированных продуктов, загрязненных клостридиями. Естественная восприимчивость высокая. Клинические формы: пищевой ботулизм (до 80%), раневой ботулизм (до 10%), ботулизм грудных детей [4, 5]. В возрастной структуре преобладают пациенты 30–50 лет [2].

🛠 Инструменты и методы

Все файлы взяты с сайта Национального центра биотехнологии (NCBI).

  • Длины белков: в Google Таблицах рассчитаны длины белков и построена гистограмма для оценки распределения размеров кодирующих последовательностей.
  • Анализ длины белка и GC-содержимого: последовательности CDS проанализированы с помощью Google Sheets, длины визуализированы.
  • Процентное содержание нуклеотидов: рассчитано для всех репликонов, представлена таблица. Для обработки использовался Python в Google Colab [3] и библиотека BioPython. Файл нуклеотидов взят с NCBI.

Результаты

По полученному распределению (Рис.1) длины белков широко варьируются: от самых маленьких (до 40 аминокислотных остатков) до крупных цепей (более 1200 остатков). Самая распространённая длина — 240–280 аминокислотных остатков [таблица 1].

Гистограмма распределения длин белков Clostridium botulinum
📈 Рис.1. Распределение длин белков, закодированных в геноме Clostridium botulinum A str. ATCC 3502 (гистограмма)

Анализ содержания GC в 3596 кодирующих последовательностях (CDS) выявил распределение, показанное на Рис.2. Большинство CDS имеют содержание GC 25–30%, что характерно для геномов с умеренно низким содержанием GC. Наибольшая частота наблюдается в интервале около 27–39%, где сосредоточено большинство генов [таблица 2].

Распределение GC-состава в CDS Clostridium botulinum
🧬 Рис.2. Распределение GC-состава в кодирующих последовательностях (CDS)

Такой уровень GC-состава влияет на стабильность ДНК и частоту мутаций. Низкое содержание GC коррелирует с использованием альтернативных кодонов и часто встречается у анаэробных бактерий, обитающих в специализированных нишах.

📎 Дополнительные материалы и частота идентификаций

🔍 Частота идентификаторов (модификации ДНК):
NOTfound: 10 | m6A: 1644 | m5C: 203 | m4C: 119 | m5C,m6A: 5 | m4C,m6A: 3 | m..: 96

Полный мини-обзор в формате PDF доступен по ссылке (Google Drive). Все таблицы и расчёты находятся в открытом доступе (Google Sheets, Colab).


📚 Литература:
[1] Smith, T. J., et al. (2018). Botulinum neurotoxin–producing bacteria. Anaerobe.
[2] CDC. (2020). National Botulism Surveillance Summary.
[3] Дополнительные коды и материалы: ссылки на Google Colab и таблицы.
[4] Peck, M. W. (2009). Biology and genomic analysis of Clostridium botulinum. Advances in Microbial Physiology.
[5] Lindström, M., Korkeala, H. (2006). Laboratory diagnostics of botulism. Clinical Microbiology Reviews.