Обзор особенностей генома бактерии Aquifex aeolicus VF5

Гипертермофильный хемолитоавтотроф · суперкороткий геном
Аксенова Ксения Олеговна
Московский государственный университет им. М. В. Ломоносова,
факультет биоинженерии и биоинформатики, Москва, Россия
Аннотация Aquifex aeolicus VF5 — гипертермофильная хемоавтотрофная бактерия с суперкоротким геномом, всего 1,5 млн нуклеотидов. Обитает она на дне океана, около подводных гейзеров. Для добычи энергии окисляет водород и соединения серы. В работе были рассмотрены GC% состав её генома и представлено сравнение частоты встречаемости различных старт-кодонов.

Введение

Таксономическая принадлежность Aquifex aeolicus VF5 [1]:

Домен: Bacteria
Тип: Aquificae
Отряд: Aquificales
Семейство: Aquificaceae
Род: Aquifex
Вид: Aquifex aeolicus VF5

Род состоит из двух видов, описанных в 1992 году: типового вида Aquifex pyrophilus (штамм Kol5a; DSM 6858) и Aquifex aeolicus, который ещё не был официально опубликован.

A. aeolicus — грамотрицательная, палочковидная, подвижная, жгутиковая, не образующая спор бактерия размером примерно 0,5×2–6 мкм [1]. Это гипертермофильная бактерия, оптимально растёт при температуре 85 °C (и до 95 °C) — одна из самых экстремальных гипертермофильных бактерий. Будучи облигатным хемолитоавтотрофом, она не использует свет или органические молекулы, а питается исключительно газами и неорганическими веществами [1, 4]. A. aeolicus — микроаэрофильный организм, получающий энергию из водорода, но также способный окислять восстановленные соединения серы (элементарную серу и тиосульфат) [1, 3].

🧬 Эволюционная значимость: это один из самых древних и глубоко ветвящихся представителей бактерий. Геном показывает признаки обширного латерального переноса генов, в том числе от архей и других термофильных бактерий [3].

Бактерия является модельным организмом для типа Aquificae [1]. Она обладает сверхстабильными белками [2] и полностью секвенированным геномом [1]. A. aeolicus стала первой гипертермофильной бактерией, геном которой был секвенирован. Геном (кольцевая хромосома) довольно мал: 1 551 335 пар оснований, что примерно в три раза меньше генома Escherichia coli [2]. Содержание GC — 43 %, что относительно низко для гипертермофила, хотя 16S рРНК имеет 65 % GC [1]. Также присутствует плазмида длиной 39 456 п.н. с 63 генами. На хромосоме идентифицирован 1731 ген (47 псевдогенов), 1632 кодируют белки, 52 — РНК [1].

Материалы и методы

Таблица особенностей генома получена с использованием Bash. С сервера NCBI скачаны файлы полной последовательности генома (fasta), последовательностей CDS и таблицы особенностей. Гистограммы построены в Google Sheets с помощью функций СЧЁТЕСЛИМН и обработки данных. Для анализа старт-кодонов написан код на Python (прилагается в сопроводительных материалах) [4].

Результаты

1. Распределение длин белков

На основе CDS были найдены длины продуктов трансляции в аминокислотах. Ниже представлена гистограмма распределения.

📊 Рис. 1. Гистограмма длин белков (в АМК)
30-80
80-130
130-180
180-230
230-280
280-330
330-380
380-430
430-480
480-530
530-580
580-630
630-680
680-730
730-780
780-830
830+

Самый высокий столбец — 130–180 АМК. Плавный спад до 480, затем резкий в диапазоне 480–530. Белков длиннее 830 АМК почти нет. Min = 32 АМК, Max = 1574 АМК.

2. GC состав генов

Гистограмма процентного содержания GC в кодирующих последовательностях.

🧬 Рис. 2. Гистограмма процентного содержания GC
30-35%
35-40%
40-45%
45-50%
50-55%
55-60%
60-65%

Преобладают гены с содержанием GC 40–45 %. Это подтверждает средний уровень ~43 %, что необычно низко для гипертермофила [1].

3. Распределение белков с различными старт-кодонами

Визуализация количества белков, начинающихся с разных старт-кодонов.

🧪 Рис. 3. Старт-кодоны белков A. aeolicus
AUG ~78%
GUG ~14%
UUG ~5%
AUU ~2%
другие ~1%

Доминирует классический AUG, однако заметна доля альтернативных старт-кодонов (GUG, UUG), что характерно для бактерий с компактным геномом.


📏 Геном: 1,55 млн п.н.
🌡️ Оптимум 85°C
🧫 GC ~43%
🧬 1632 белка