Мини-обзор генома бактерии Aliivibrio fischeri ES114

Алихан Жангазиев1
1Факультет Биоинженерии и Биоинформатики МГУ им. М. В. Ломоносова,
город Москва, территория Ленинские горы, 1с73
Контакты: kulan@fbb.msu.ru
Аннотация

Данный обзор посвящен краткому анализу генома симбиотической бактерии Aliivibrio fischeri ES114, выделенного из органа свечения Euprymna scolopes.

Введение

Объектом данного исследования является бактерия Aliivibrio (ранее Vibrio) fischeri ES114, грамотрицательная, морская бактерия из филума Pseudomonadota (Таблица 1). A. fischeri может вступать в симбиоз с Euprymna scolopes, в котором осуществляет биолюминесценцию в органе свечения в мантии головоногого [1].

Таблица 1. Систематическое положение бактерии [2]
DomainBacteria
KingdomPseudomonadati
PhylumPseudomonadota
ClassGammaproteobacteria
OrderVibrionales
FamilyVibrionaceae
GenusAliivibrio
SpeciesAliivibrio fischeri
StrainAliivibrio fischeri ES114

Бактерия встречается как в свободной форме, так и в симбиозе с морскими организмами. Однако люминесценция встречается, когда бактерия колонизирует орган симбионта, а не в свободной форме [3]. При этом симбиотическая форма утрачивает полярные жгутики и теряет способность к движению [4]. A. fischeri используется в экотоксикологии для оценки уровня загрязнения по ингибированию люминесценции [5]. A. fischeri является модельным объектом для изучения чувства кворума в бактериальных популяциях. Бактерия имеет 2 системы чувства кворума, которые играют роль в колонизации симбионта [6]. Несмотря на то, что род Aliivibrio и родственная группа Vibrio содержат патогенных представителей (например, A. salmonicida, V. cholerae, V. vulnificus) для A. fischeri не была показана патогенность [7]. Поэтому бактерию используют в сравнительной геномике для выявления особенностей генома, отличающих A. fischeri от патогенных бактерий рода Vibrio и Aliivibrio [8]. Таким образом, данная бактерия имеет большое значение для практических исследований. Согласно анализу времени дивергенции, бактерия произошла в Девоне (385 млн. лет назад), этот период сопутствовал активной дивергенции головоногих моллюсков и лучеперых рыб [9].

Методы

Данные о геноме Aliivibrio fischeri, Vibrio cholerae, Vibrio natriegens и Vibrio harveyi были взяты с сайта Национального Центра Биотехнологической информации (NCBI). Для анализа последовательности использовались электронные таблицы, командная оболочка BASH, скрипты, написанные на языке Python.

Скрипт, написанный на языке Python, использовался для подсчета длины репликонов, длины и доли кодирующей последовательности, нуклеотидного состава репликона и GC-skew (S1 в сопроводительных материалах).

Электронные таблицы использовались для подсчета типов генов на каждом репликоне (S2 в сопроводительных материалах), построения гистограммы длин белков, распределения GC-состава по CDS и дальнейшая статистическая обработка этих гистограмм (S3 в сопроводительных материалах).

Результаты

1. Основные данные о геноме A. fischeri

Геном бактерии представлен тремя репликонами: две хромосомы и плазмида pES100. Первая хромосома содержит многие важные гены, при этом ее размер в семействе сохраняется относительно постоянным [10]. Также этой хромосоме в семействе Vibrionaceae свойственна низкая частота внутрихромосомных перестроек [11]. При этом для второй хромосомы характерна вариабельность в размере в семействе. Согласно одной из гипотез, хромосома 2 произошла от мегаплазмиды у предка Vibrionaceae, т.к. все представители семейства имеют 2 хромосомы. Эта плазмида стабилизировалась из-за переноса на нее некоторых важных генов [10, 12]. Видимо, это приобретение произошло достаточно давно, потому что GC составы этих репликонов примерно равны (Табл. 2).

Таблица 2. Стандартные данные о репликонах.
РепликонДлина, п.н.GC-состав, %
Хромосома I289753638.95
Хромосома II133033337.02
Плазмида pES1004584938.42

Лимитирующим фактором в размножении бактерии зачастую становится скорость репликации, поэтому в геноме не должно быть лишних элементов. Поэтому в их геноме поддерживается высокая доля кодирующей последовательности (в среднем около 88%) [13]. Геном A. fischeri тоже содержит низкую долю некодирующих последовательностей (Табл. 3).

Таблица 3. Длина и доля кодирующей последовательности (%CDS).
РепликонДлина кодирующей последовательности, п.н.%CDS
Хромосома I251810286.90
Хромосома II116593287.64
Плазмида pES1004017687.63

Также было определено количество различных типов генов в репликонах бактерии. При этом можно заметить, что количество рРНК и тРНК относительно общего количества генов в репликоне значительно меньше для второй хромосомы (Табл. 4), что снова подтверждает гипотезу о приобретении хромосомы II через мегаплазмиду (жизненно необходимые гены, такие как гены рРНК, концентрируются на хромосоме I и еще не успели перенестись на хромосому II). При этом существует гипотеза о том, что при изменении условий среды при делении бактерии могут производить так называемые "дроновые клетки", которые несут только хромосому II и не способны реплицироваться, при этом на хромосоме II есть гены метаболизма и образования биопленок, экспрессия которых в теории должна помочь общей популяции пережить эти неблагоприятные условия [12].

На хромосоме I находятся гены некоторых минорных РНК, таких как ген РНК субъединицы РНКазы P. Рибонуклеаза P участвует в процессинге 5'-конца тРНК. При этом РНК субъединица показывает рибозимную активность также в отсутствии белковой субъединицы [14]. Также хромосома I несет ген SRP РНК. Эта молекула РНК входит в рибонуклеотидный комплекс, который участвует в ко- и посттрансляционном транспорте белков к внутренней мембране [15]. На хромосоме I можно найти тмРНК. Транспортно-матричные РНК имеют структурные особенности как транспортных, так и матричных РНК, при этом тмРНК участвует в механизме транс-трансляции, который позволяет рибосоме освободиться от дефектной мРНК без стоп-кодона [16].

Таблица 4. Число генов на разных репликонах.
Тип генаХромосома IХромосома IIpES100
protein_coding2541115156
pseudogene33120
ncRNA100
RNase_P_RNA100
rRNA3430
SRP_RNA100
tRNA108110
tmRNA100

Второе правило Чаргаффа гласит, что процентный состав комплементарных нуклеотидов на одной цепи ДНК примерно равны [17]. Соответственно, данные по нуклеотидному составу репликонов согласуются с этим правилом (Табл. 5). При этом для плазмиды из-за небольшой длины цепи содержание комплементарных нуклеотидов отличается больше чем у хромосом.

Таблица 5. Нуклеотидный состав репликонов.
РепликонA, %T, %G, %C, %
Хромосома I30.4730.5819.5119.45
Хромосома II31.8031.1718.6018.42
pES10033.3928.1920.2018.22

2. Распределение длин белков A. fischeri

Для протеома A. fischeri было определено распределение числа белков в зависимости от количества аминокислотных остатков (Рис. 1). Больше всего белков в области 200-300 аминокислотных остатков. Для этого распределения были определены некоторые статистические показатели (Таблица 6).

Гистограмма распределения длин белков
Рис. 1. Распределение длин белков A. fischeri в аминокислотных остатках.
Таблица 6. Статистические параметры распределения длин белков.
Медиана285
Среднее значение326.49
Стандартное отклонение232.41
Максимальная длина3971
Минимальная длина29

Белок с максимальным количеством аминокислотных остатков — это RtxA1 (кальций-связывающий цитотоксин), для которого была показана токсичность у патогенных видов рода Vibrio (например, патоген человека V. vulnificus) [18]. Но у A. fischeri наличие этого белка не было доказано, его предсказали по соответствующей последовательности в геноме [19].

Белок из семейства YnhF мембранных белков имеет наименьшее количество аминокислотных остатков в протеоме. У Escherichia coli этот белок является добавочной субъединицей цитохрома bd-I. Эта субъединица найдена только у представителей клады протеобактерий и занимает предполагаемое место входа кислорода в bd-оксидазе [20].

3. Распределение CDS по GC-составу

Была построена столбчатая диаграмма, отражающая распределение CDS по GC-составу у A. fischeri (Рис. 2), также для данных по распределению были вычислены некоторые статистические параметры (Таблица 7).

Гистограмма распределения CDS по GC-составу
Рис. 2. Распределение CDS A. fischeri по GC-составу.
Таблица 7. Статистические параметры распределения GC%.
Медиана38.99
Среднее значение38.645
Стандартное отклонение3.47
Максимальный GC%49.74
Минимальный GC%19.05

A. fischeri имеет самый низкий средний GC-состав в геноме среди всех видов родов Aliivibrio и Vibrio [19].

4. GC-skew

Для двух хромосом были посчитаны значения GC-skew и кумулятивного GC-skew (Рис. 3). GC-skew показывает представленность гуанина в участке ДНК (оценивает неравномерность распределения нуклеотидов).
GC-skew = (G-C)/(G+C)
Кумулятивный GC-skew показывает сумму значений GC-skew на участке от начала до искомой позиции. Известно, что максимальное значение кумулятивного параметра отвечает за точку терминации, а минимальное значение — за точку начала репликации [21]. Таким образом для хромосом I и II были посчитаны oriC и ter: для I: 2894103 нуклеотид и 1454294 нуклеотид, соответственно; для II: 1328670 нуклеотид и 657020 нуклеотид соответственно.

GC-skew хромосома I
GC-skew хромосома II
Рис. 3 А: GC-skew для хромосомы I. Б: GC-skew для хромосомы II. Ось X — значения GC-skew, для кумулятивного — GC-skew/100. Ось Y — позиция в геноме.

5. Сравнение GC в семействе Vibrionaceae

Был проанализирован GC-состав хромосом I у нескольких видов семейства Vibrionaceae (Aliivibrio fischeri, Vibrio cholerae (Vc), Vibrio natriegens (Vn), Vibrio harveyi (Vh)) по всей длине. На основе графика (Рис. 4) можно выдвинуть гипотезу о том, что, возможно, некоторые участки передавались горизонтальным переносом от Aliivibrio fischeri и поэтому эти регионы у Vc, Vn, Vh имеют GC-состав ниже, чем в среднем по геномам этих бактерий.

В дальнейшем можно проанализировать геномы Vibrionaceae для выявления конкретных участков, которые имеют близкий GC-состав к Aliivibrio fischeri, и наличие в них каких-либо маркеров горизонтального переноса. На основе этих данных можно будет построить новые эволюционные гипотезы. Также анализ различий близкородственных видов, которые являются патогенами и симбионтами, поможет уточнить механизмы патогенности.

Сравнение GC-состава по геномам
Рис. 4. Сравнение GC-состава по геномам Aliivibrio fischeri (синий), Vibrio cholerae (желтый), Vibrio natriegens (зеленый), Vibrio harveyi (красный). Ось X — положение в геноме, ось Y — GC-состав в %. (Рисунок в хорошем расширении в сопроводительных материалах S4)

Сопроводительные материалы

S1 Genome_Aliivibrio.ipynb (Google Colab)

S2 Genomic features of Aliivibrio fischeri ES114 (Google Sheets)

S3 CDS from genome of Aliivibrio fischeri ES114 (Google Sheets)

S4 Изображение в хорошем качестве (Google Drive)

Список литературы

  1. Aizawa, Shin-Ichi. The flagellar world: electron microscopic images of bacterial flagella and related surface structures. Elsevier, 2013. 16-17.
  2. Schoch CL, et al. NCBI Taxonomy: a comprehensive update on curation, resources and tools. Database (Oxford). 2020: baaa062. PubMed: 32761142; PMC: PMC7408187. [NCBI Taxonomy]
  3. RUBY, Edward G., and Kenneth H. NEALSON. "Symbiotic association of Photobacterium fischeri with the marine luminous fish Monocentris japonica: a model of symbiosis based on bacterial studies." The Biological Bulletin 151.3 (1976): 574-586.
  4. Ruby, E. G., and L. M. Asato. "Growth and flagellation of Vibrio fischeri during initiation of the sepiolid squid light organ symbiosis." Archives of microbiology 159.2 (1993): 160-167.
  5. Froehner, K., T. Backhaus, and L. H. Grimme. "Bioassays with Vibrio fischeri for the assessment of delayed toxicity." Chemosphere 40.8 (2000): 821-828.
  6. Lupp, Claudia, and Edward G. Ruby. "Vibrio fischeri uses two quorum-sensing systems for the regulation of early and late colonization factors." Journal of bacteriology 187.11 (2005): 3620-3629.
  7. Christensen, David G., and Karen L. Visick. "Vibrio fischeri: laboratory cultivation, storage, and common phenotypic assays." Current protocols in microbiology 57.1 (2020): e103.
  8. Lilburn, Timothy G., et al. "Comparative genomics of the family Vibrionaceae reveals the wide distribution of genes encoding virulence-associated proteins." BMC genomics 11.1 (2010): 369.
  9. Lin, Heyu, et al. "Comparative genomic analysis reveals the evolution and environmental adaptation strategies of vibrios." BMC genomics 19.1 (2018): 135.
  10. Okada, Kazuhisa, et al. "Vibrios commonly possess two chromosomes." Journal of bacteriology 187.2 (2005): 752-757.
  11. Makino, Kozo, et al. "Genome sequence of Vibrio parahaemolyticus: a pathogenic mechanism distinct from that of V. cholerae." The Lancet 361.9359 (2003): 743-749.
  12. Heidelberg, John F., et al. "DNA sequence of both chromosomes of the cholera pathogen Vibrio cholerae." Nature 406.6795 (2000): 477-483.
  13. Kirchberger, Paul C., Marian L. Schmidt, and Howard Ochman. "The ingenuity of bacterial genomes." Annual Review of Microbiology 74.1 (2020): 815-834.
  14. Evans, Donald, Steven M. Marquez, and Norman R. Pace. "RNase P: interface of the RNA and protein worlds." Trends in biochemical sciences 31.6 (2006): 333-341.
  15. Rosenblad, Magnus Alm, et al. "Kinship in the SRP RNA family." RNA biology 6.5 (2009): 508-516.
  16. Muto, Akira, Chisato Ushida, and Hyouta Himeno. "A bacterial RNA that functions as both a tRNA and an mRNA." Trends in biochemical sciences 23.1 (1998): 25-29.
  17. Rudner, Rivka, John D. Karkas, and Erwin Chargaff. "Separation of B. subtilis DNA into complementary strands. 3. Direct analysis." Proceedings of the National Academy of Sciences 60.3 (1968): 921-922.
  18. Satchell, Karla JF. "Multifunctional-autoprocessing repeats-in-toxin (MARTX) Toxins of Vibrios." Microbiology spectrum 3.3 (2015): 10-1128.
  19. Ruby, Edward G., et al. "Complete genome sequence of Vibrio fischeri: a symbiotic bacterium with pathogenic congeners." Proceedings of the National Academy of Sciences 102.8 (2005): 3004-3009.
  20. Safarian, Schara, et al. "Active site rearrangement and structural divergence in prokaryotic respiratory oxidases." Science 366.6461 (2019): 100-104.
  21. Grigoriev, Andrei. "Analyzing genomes with cumulative skew diagrams." Nucleic acids research 26.10 (1998): 2286-2290.