В данном мини-обзоре представлены ключевые характеристики генома бактерии Euzebya pacifica, включая распределение длин кодируемых белков, распределение белок-кодирующих последовательностей между + и - цепями, распределение GC-состава кодирующих последовательностей (CDS) и длина (в нуклеотидах) между кодирующими последовательностями (CDS). Анализ этих данных позволяет получить представление об организации генома, особенностях кодируемых белков и потенциальных функциональных адаптациях.
Euzebya pacifica — вид грамположительных, аэробных, хемоорганотрофных, палочковидных и не образующих спор бактерий, выделенный в 2021 году [1]. Название связано с Тихим океаном, из которого был изолирован типовой штамм [1]. Колонии розового цвета, оптимально растут при температуре 30–35 °C, концентрации хлорида натрия 1–2 % и pH 6,5. Вид Euzebya pacifica может расти без хлорида натрия [2].
Царство: Bacteria
Тип: Actinomycetota
Класс: Nitriliruptoria
Порядок: Euzebyales
Семейство: Euzebyaceae
Род: Euzebya
Вид: Euzebya pacifica
Файл CDS, содержащий кодирующую последовательность ДНК, таблица локальных особенностей feature table и таблица переведенных CDS. Анализ данных, создание сводных таблиц и гистограмм были осуществлены с помощью электронных таблиц Google Sheets: с помощью файла CDS была создана гистограмма, показывающая количество длин белков на различных интервалах, гистограмма GC% генов (см. сопроводительные материалы 1). С помощью файла Feature table была создана гистограмма распределение межгенных промежутков и диаграммы распределения белок-кодирующих последовательностей между + и - цепями (см. сопроводительные материалы 2).
Гистограмма показывает распределение длин белков по различным диапазонам значений, закодированных в геноме бактерии Euzebya pacifica (рис.1), видно, что по горизонтали указаны диапазоны длин, а по вертикали — количество белков в каждом диапазоне. Наиболее часто встречающиеся длины находятся в диапазоне 100-150. Далее количество уменьшается.
Гистограмма представляет собой распределение количества белков в зависимости от их GC-состава (рис.2). Наибольшее количество белков наблюдается в диапазоне 71-73 с постепенным увеличением от более низких диапазонов и последующим уменьшением после пика.
При анализе генома бактерии исследовали расстояния между соседними генами (рис. 3). Было обнаружено много случаев, когда гены расположены очень близко друг к другу или даже перекрываются. Это свидетельствует об оперонной организации генома, характерной для прокариот [3]. Оперонная организация генома — это принцип организации генов у прокариот, при котором несколько генов объединяются в единую функциональную единицу - оперон [4]. Она позволяет последовательно кодировать белки и регулировать транскрипцию генов [4].
Исходя из полученных диаграмм (рис. 4 и рис. 5), видно, что на хромосоме гены на + и - цепочках распределены относительно равномерно, поскольку доля генов на + цепи составляет около 49%. На плазмиде прослеживается перевес генов в пользу + цепи 61%, что указывает на выраженную асимметричную структуру плазмиды.
CDS from genome of Euzebya pacifica