🧬 Аннотация: В этом обзоре проанализирована структура генома Clostridium botulinum A str. ATCC 3502: длины белков, их распределение по геному, нуклеотидный состав. Описаны инструменты анализа и биологическое значение бактерии.
📌 Введение
Бактерия Clostridium botulinum A str. ATCC 3502 относится к царству Bacillati, типу Bacillota, классу Clostridia, порядку Eubacteriales, семейству Clostridiaceae, роду Clostridium. Clostridium botulinum – грамположительные палочковидные анаэробные спорообразующие подвижные бактерии. Таксономическим признаком является способность синтезировать ботулинический нейротоксин (ботулотоксин), вызывающий ботулизм [1].
Ботулизм встречается во всех странах мира в виде спорадических случаев или вспышек. Человек заражается при употреблении консервированных продуктов, загрязненных клостридиями. Естественная восприимчивость высокая. Клинические формы: пищевой ботулизм (до 80%), раневой ботулизм (до 10%), ботулизм грудных детей [4, 5]. В возрастной структуре преобладают пациенты 30–50 лет [2].
🛠 Инструменты и методы
Все файлы взяты с сайта Национального центра биотехнологии (NCBI).
- Длины белков: в Google Таблицах рассчитаны длины белков и построена гистограмма для оценки распределения размеров кодирующих последовательностей.
- Анализ длины белка и GC-содержимого: последовательности CDS проанализированы с помощью Google Sheets, длины визуализированы.
- Процентное содержание нуклеотидов: рассчитано для всех репликонов, представлена таблица. Для обработки использовался Python в Google Colab [3] и библиотека BioPython. Файл нуклеотидов взят с NCBI.
Результаты
По полученному распределению (Рис.1) длины белков широко варьируются: от самых маленьких (до 40 аминокислотных остатков) до крупных цепей (более 1200 остатков). Самая распространённая длина — 240–280 аминокислотных остатков [таблица 1].
Анализ содержания GC в 3596 кодирующих последовательностях (CDS) выявил распределение, показанное на Рис.2. Большинство CDS имеют содержание GC 25–30%, что характерно для геномов с умеренно низким содержанием GC. Наибольшая частота наблюдается в интервале около 27–39%, где сосредоточено большинство генов [таблица 2].
Такой уровень GC-состава влияет на стабильность ДНК и частоту мутаций. Низкое содержание GC коррелирует с использованием альтернативных кодонов и часто встречается у анаэробных бактерий, обитающих в специализированных нишах.
📎 Дополнительные материалы и частота идентификаций
NOTfound: 10 | m6A: 1644 | m5C: 203 | m4C: 119 | m5C,m6A: 5 | m4C,m6A: 3 | m..: 96
Полный мини-обзор в формате PDF доступен по ссылке (Google Drive). Все таблицы и расчёты находятся в открытом доступе (Google Sheets, Colab).
📚 Литература:
[1] Smith, T. J., et al. (2018). Botulinum neurotoxin–producing bacteria. Anaerobe.
[2] CDC. (2020). National Botulism Surveillance Summary.
[3] Дополнительные коды и материалы: ссылки на Google Colab и таблицы.
[4] Peck, M. W. (2009). Biology and genomic analysis of Clostridium botulinum. Advances in Microbial Physiology.
[5] Lindström, M., Korkeala, H. (2006). Laboratory diagnostics of botulism. Clinical Microbiology Reviews.