Мини-обзор бактерии

Cupriavidus cauae

Автор: Петрова София Юрьевна

Аннотация: В данной статье собраны и проанализированы основные сведения о геноме бактерии Cupriavidus cauae.


1. Введение

Cupriavidus cauae – это подвижная, палочковидная, факультативно-аэробная, грамотрицательная бактерия, выделенная из крови человека с иммунодефицитом. Образует колонии кремово-желтого цвета. Может расти при температурном диапазоне 10–45 °C (оптимально 37–40 °C), в присутствии 0–10 % NaCl (оптимально 0,5%) и при диапазоне водородного показателя (pH) 6,0–10,0 (оптимально 7.0) (под «оптимально» подразумеваются наиболее благоприятные условия для роста колонии). Геном бактерии составляет 5 750 268 пар нуклеотидов.

Таблица 1. Таксономическое положение бактерии.
Домен Bacteria
Филум Pseudomonadota
Класс Betaproteobacteria
Отряд Burkholderiales
Семейство Burkholderiaceae
Род Cupriavidus
Вид Cupriavidus cauae

Эта бактерия наиболее близкородственная с Cupriavidus gilardii из того же рода (схожесть генома 92.1%). По своей сути является новым и пока малоизученным видом из рода Cupriavidus. Данный род является очень разнообразным по типу нахождения представителей, так как были найдены организмы, обитающие как в почве, на очистных сооружениях и грунтовых водах, так и в теле человека. Чаще всего бактерии из этого рода встречаются в воде, поэтому можно сделать вывод, что способ проникновения Cupriavidus cauae заключался в попадании ее (бактерии) путем употребления воды. Данные получены из исследования, проведенного в 2021 году в университетской больнице Чунг-Анг, Сеул, Республика Корея [1].



2. Методы и материалы

Материалы о геноме бактерии такие как: feature table, были получены с сайта NCBI (Национальный центр Биотехнологической информации) [2].

Для обработки полученной информации была использована платформа Google Sheets (Google таблицы) [3].

Методы работы в электронных таблицах:

1. Подсчет количества белков определенной длины осуществлялся с помощью функции «СЧЕТЕСЛИМН» («COUNTIFS»).

2. Были построены гистограммы для получение наглядного отображения количественных результатов.


3. Результаты
3.1 Количество генов в разных репликонах

Данные, представленные в таблице (таблица 2), отражают количество генов бактерии на разных репликонах, а именно на двух хромосомах (1 и 2). Можно заметить, что 1 хромосома является большей по размеру и на ней закодированы все виды РНК (tRNA=тРНК – транспортная РНК, tmRNA=тмРНК – транспортно-матричная, rRNA=рРНК – рибосомальная РНК, ncRNA – некодирующая РНК), в то время как на второй хромосоме присутствуют лишь рибосомальная РНК и транспортная РНК. Также первая хромосома является лидирующей по количеству закодированных белков (CDS). Не трудно догадаться, что основную часть занимают как раз таки CDS, а на все РНК на первой хромосоме уходит лишь 2%, на второй – 0,4%.

Таблица 2. Гены белков и РНК на различных репликонах.
Genomic _accession seq_type chromosome CDS ncRNA rRNA tmRNA tRNA
NZ_CP080293.1 chromosome 1 3064 2 9 1 51
NZ_CP080294.1 chromosome 2 1952 0 3 0 6

3.2 Длина белков

Длины белков бактерии Cupriavidus cauae в основном представлены в диапазоне 50-700, но есть единичные случаи с длинной более 2000 аминокислотных остатков (таких примерно 8). Наибольшее число белков имеют в своем составе 300-350 аминокислотных остатков. Очень мало содержат 50 и меньше и 900 и больше. Данные отражены в гистограмме (Рис.1). На ней можно увидеть, что идет не равномерное распределение длин, а более скачкообразное, где есть небольшой скачек от 100 до 150 и резкое снижение числа в районе 350-400 аминокислот.

gistoaminoacid

Рис.1 Гистограмма длин белков.


3.3 Пересечения кодирующих последовательностей (CDS)

У прокариот часто происходит перекрытие генов для уменьшения длины (размера) своего генома. Это возможно благодаря наличию различных открытых рамок считывания. Это интересно изучать для возможности прогнозирования наличия закодированного белка и/или других элементов. Простыми словами – поиск длин перекрываний кодирующих последовательностей равносилен поиску открытых рамок считывания. В бактерии Cupriavidus cauae естесвенно присутствуют пересечения. В основном они не больше, чем 2-3 нуклеотида, но, естественно, существуют и большие. Самое длинное пересечение составляет 114 пар нуклеотидов, это означает, что с такого участка может кодироваться достаточно много белков. Наглядные о длине пересечений представлены в гистограмме (рис.2).

Peresechenia

Рис.2 Гистограмма длин пересечений кодирующих последовательностей.


4. Список литературы и сопроводительные материалы

[1] Kweon OJ, Ruan W, Khan SA, Lim YK, Kim HR, Jeon CO, Lee MK. Cupriavidus cauae sp. nov., isolated from blood of an immuno-compromised patient. Int J Syst Evol Microbiol. 2021 Apr;71(4). doi: 10.1099/ijsem.0.004759. Erratum in: Int J Syst Evol Microbiol. 2021 Apr;71(4): PMID: 33847555.

[2] Сайт Национального Национального Центра Биотехнологической Информации

[3] Таблица Google Sheet