Таксономическая принадлежность Aquifex aeolicus VF5 [1]:
Род состоит из двух видов, описанных в 1992 году: типового вида Aquifex pyrophilus (штамм Kol5a; DSM 6858) и Aquifex aeolicus, который ещё не был официально опубликован.
A. aeolicus — грамотрицательная, палочковидная, подвижная, жгутиковая, не образующая спор бактерия размером примерно 0,5×2–6 мкм [1]. Это гипертермофильная бактерия, оптимально растёт при температуре 85 °C (и до 95 °C) — одна из самых экстремальных гипертермофильных бактерий. Будучи облигатным хемолитоавтотрофом, она не использует свет или органические молекулы, а питается исключительно газами и неорганическими веществами [1, 4]. A. aeolicus — микроаэрофильный организм, получающий энергию из водорода, но также способный окислять восстановленные соединения серы (элементарную серу и тиосульфат) [1, 3].
Бактерия является модельным организмом для типа Aquificae [1]. Она обладает сверхстабильными белками [2] и полностью секвенированным геномом [1]. A. aeolicus стала первой гипертермофильной бактерией, геном которой был секвенирован. Геном (кольцевая хромосома) довольно мал: 1 551 335 пар оснований, что примерно в три раза меньше генома Escherichia coli [2]. Содержание GC — 43 %, что относительно низко для гипертермофила, хотя 16S рРНК имеет 65 % GC [1]. Также присутствует плазмида длиной 39 456 п.н. с 63 генами. На хромосоме идентифицирован 1731 ген (47 псевдогенов), 1632 кодируют белки, 52 — РНК [1].
Таблица особенностей генома получена с использованием Bash. С сервера NCBI скачаны файлы полной последовательности генома (fasta), последовательностей CDS и таблицы особенностей. Гистограммы построены в Google Sheets с помощью функций СЧЁТЕСЛИМН и обработки данных. Для анализа старт-кодонов написан код на Python (прилагается в сопроводительных материалах) [4].
На основе CDS были найдены длины продуктов трансляции в аминокислотах. Ниже представлена гистограмма распределения.
Самый высокий столбец — 130–180 АМК. Плавный спад до 480, затем резкий в диапазоне 480–530. Белков длиннее 830 АМК почти нет. Min = 32 АМК, Max = 1574 АМК.
Гистограмма процентного содержания GC в кодирующих последовательностях.
Преобладают гены с содержанием GC 40–45 %. Это подтверждает средний уровень ~43 %, что необычно низко для гипертермофила [1].
Визуализация количества белков, начинающихся с разных старт-кодонов.
Доминирует классический AUG, однако заметна доля альтернативных старт-кодонов (GUG, UUG), что характерно для бактерий с компактным геномом.