Мини-обзор генома бактерии Mycetocola zhujimingii

Mycetocola это род, впервые описанный в 2001 году в составе семейства Microbacteriaceae. В 2019 году была описана бактерия Mycetocola zhujimingii, она была выделена из фекалий Тибетской антилопы (Pantholops hodgsonii)[1]. Данная антилопа обитает на самом высоком нагорье в мире (Цинхай-Тибетском нагорье) и считается почти самым малоизученным парнокопытным животным. Mycetocola zhujimingii это грамположительная, не образующая спор, аэробная бактерия, размерами примерно 0,3– 0,6×0,9–2,2 мкм. Полную таксономию можно видеть в таблице 1.

Таблица 1. Таксономическое положение M .zhujimingii

Систематическая группа

Наименование

Тип

Actinomycetota

Класс

Actinomycetia

Порядок

Micrococcales

Семейство

Microbacteriaceae

Род

Mycetocola

Вид

Mycetocola zhujimingii

Результаты данного мини-обзора были получены с помощью ряда методов. Для анализа таблицы особенностей бактерии Mycetocola zhujimingii были использованы Google sheets, благодаря данному инструменту были построены различные гистограммы: распределение длин белков (формула =СЧЁТЕСЛИМН), исследование пересекающихся генов, кодирующих белки (формула =ЕСЛИ), исследование расстояний между генами и таблицы распределение генов белков и разных типов РНК по репликонам (формула =СЧЁТЕСЛИМН), общее число различных кодирующих последовательностей и их типов. Исходная таблица особенностей M. zhujimingii была скачана с NCBI и уже с ней впоследствии производились преобразования[2].

Из рисунка 1 можно сделать вывод, что для данной бактерии наиболее характерны белки длиной 200-300 аминокислотных остатков. Также много белков чуть меньшей длины (100-200 аминокислотных остатков) и чуть большей длины (300-400 аминокислотных остатков). Самым длинным(1950 аминокислотных остатков) оказался белок Ig-like domain-containing protein. Белки с иммуноглобулиноподобными доменами часто используются бактериями для клеточной адгезии[3], также подобные белки были найдены у паразитических энтеробактерий[4]. Из данной информации и знания о том, откуда была выделена эта бактерия, можно сделать предположение, что она обитает в кишечнике антилопы (а не была занесена на фекалии другими способами). Самым маленьким белком (32 аминокислотных остатка) оказался AURKAIP1/COX24 domain-containing protein с не до конца ясной функцией.

Рис. 1. Гистограмма длин белков.

Как видно из таблицы 2, большую часть генома занимают кодирующие белок последовательности. При этом всего в геноме закодировано 47 транспортных РНК из 61 возможной. Это можно объяснить явлением вобблинга, когда первые 2 пары кодон- антикодон при трансляции мРНК являются Уотсон-Криковскими, а самая последняя пара необязательно будет являться такой. При этом в первом положении антикодона (которое образует водородные связи с третьим положением кодона) может встречаться достаточно редкое для нуклеиновых кислот основание — инозин. Инозин способен образовывать водородные связи с аденином, урацилом и цитизином, находящимися в 3 положении кодона. При этом специфичность связывания задают 2 первые связи между кодоном и антикодоном, а благодаря “колебаниям” третьей мы видим не все тРНК в геноме данной бактерии, так не все они необходимы клетке.

Таблица 2. Количество генов, кодирующих РНК и белки.

Gene 3062
CDS 3003
tRNA 47
ncRNA 2
tmRNA 1
rRNA 9

Таблица 3. Распределение белков и различных типов РНК по репликонам.

genomic_accession seq_type chromosome CDS tRNA rRNA ncRNA tmRNA
NZ_CP026949.1 chromosome 2996 47 9 2 1
NZ_CP026950.1 plasmid unnamed 37 0 0 0 0

Из таблицы 3 видно, что все виды РНК закодированы в хромосомном геноме, в то время как в геноме плазмиды закодировано всего 37 белков. Большая часть из них гипотетические, много белков, участвующих в репликации плазмиды и её последующей передаче другим бактериям. Но в глаза сразу бросается ген, кодирующий cobalamin biosynthesis protein CobQ (белок биосинтеза кобаламина). Скорее всего, в биосинтезе кобаламина и заключается основная функция плазмиды. (у некоторых видов из кишечной микрофлоры человека тоже имеется такая способность, что ещё больше нас наталкивает на мысль, что перед нами именно энтеробактерия).

Из рисунка 2 следует, что для данной бактерии наиболее характерны расстояния между генами, кодирующими белки, равные от 800 до 900 нуклеотидов. При этом достаточно часто встречаются расстояния больше (от 900 до 1000 нуклеотидов) и меньше (от 400 до 800 нуклеотидов). В этих промежутках могут располагаться как важные регуляторные последовательности, необходимые для регуляции экспрессии генов, так и гены различных РНК.

Рис. 2. Гистограмма длин белков M. zhujimingii.

Для Mycetocola zhujimingii наиболее характерны перекрывания генов длиной от 1 до 5 нуклеотидов. При этом наибольшей интерес представдяют гены, котрые перекрываются на куда большие интервалы нуклеотидов. К примеру, ген рекомбиназы/интегразы тирозинового типа перекрывается на 106 нуклеотидов с геном N-терминальной фаговой интегразы, содержащей SAM-домен (в её активном центре так же имеются остатки тирозина). Можно сделать предположение, что когда-то фаг заразил предковую бактерию и встроил свой геном в геном бактерии, последующие мутации могли привести к возникновению из гена фага нового гена со сходной функцией продукта трансляции[5]. Ещё я обратил внимание на 3 последовательно пересекающихся гена (то есть первый ген пересекается со вторым, а второй с третьим). Причём первый ген первый пересекается со вторым на 31 нуклеотид, а второй с третьим на 6 нуклеотидов. 1 ген — УДФ-N-ацетилмурамоил-L-аланин-D-глутаматлигаза. 2 ген — липид II-флиппаза FtsW. 3 ген — УДФ-N-ацетилглюкозамин-N-ацетилмурамил-(пентапептид) пирофосфорил-ундекапренол-N-ацетилглюкозаминтрансфераза. Все 3 гена задействованы в построении клеточной стенки у бактерий [6,7,8]. Поэтому смею предположить, что первые 2 гена могут экспрессироваться как один цистрон, в результате чего FtsW (трансмембранный переносчик) может служить якорем для фермента УДФ-N-ацетилмурамоил-L-аланин-D-глутаматлигаза. В связи продукта 3 гена с FtsW я не конца уверен, ведь пересечение относительно небольшое, но всё же не исключено, что N-ацетилглюкозаминилтрансфераза тоже может закрепляться на мембране благодаря переносчику FtsW.

Рис. 3. Распределение интервалов пересечения генов у Mycetocola zhujimingii.

[1] Описание Mycetocola zhujimingii. Mycetocola zhujimingii sp. nov., isolated from faeces of Tibetan antelopes (Pantholops hodgsonii). Junqin Li et all, Microbiology society, 2019.

[2] Исходная таблица особенностей M. zhujimingii и последовательность генома были взяты с сайта NCBI

[3] Функции белков с Ig-подобными доменами у бактерий

[4] Наличие Ig-подобного домена у энтеробактерий Immunoglobulin domains in Escherichia coli and other enterobacteria: from pathogenesis to applications in antibody technologies. Gustavo Bodelón, Carmen Palomino, Luis Ángel Fernández, FEMS Microbiology Reviews, 2013.

[5] Про возникновение новых генов. Birth of a unique enzyme from an alternative reading frame of the preexisted, internally repetitious coding sequence. S Ohno, Proc Natl Acad Sci U S A, 1984

[6] Роль УДФ-N-ацетилмурамоил-L-аланин-D-глутаматлигаза в построении клеточной стенки. Enzymatic Synthesis of the Peptide in Bacterial Uridine Nucleotides: I. ENZYMATIC ADDITION OF l-ALANINE, d-GLUTAMIC ACID, AND l-LYSINE. Eiji Ito, Jack L. Strominger, The Journal of Biological Chemistry, 1962.

[7] Роль переносчика FtsW в построении клеточной стенки Identification of FtsW as a transporter of lipid-linked cell wall precursors across the membrane. Tamimount Mohammadi et all, EMBO J, 2011 Apr 20; 30(8): 1425–1432.

[8] Роль УДФ-N-ацетилглюкозамин-N-ацетилмурамил-(пентапептид) пирофосфорил- ундекапренол-N-ацетилглюкозаминтрансфераза в построении клеточной стенки. UDP-N-acetylglucosamine: N-acetylmuramoyl-(pentapeptide) pyrophosphoryl undecaprenol N-acetylglucosamine transferase from Escherichia coli: overproduction, solubilization, and purification.M Crouvoisier, D Mengin-Lecreulx, J van Heijenoort, FEBS Lett. 1999 Apr 23;449(2-3):289-92.