Мини-обзор генома бактерии Halomonas venusta

Автор: Бабаковский Марк Денисович1

Аннотация: В данной работе рассмотрен геном и протеом бактерии Halomonas venusta. Рассмотрено распределение длин межгенных промежутков, длин белков и распределение по репликонам. А также был произведен анализ соседних CDS на предмет закодированности на одной цепи.

1 Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова, Москва.
Контактные данные: babakovskijm@gmail.com

Введение

Halomonas venusta - грамотрицательная галофильная псевдомонада, впервые описанная как Alcaligenes venustus (Baumann et al. 1972), а затем переклассифицированная в Halomonas venusta вместе с другими видами, когда роды Deleya (Baumann et al. 1983), Halomonas (Vreeland et al. 1980), Halovibrio (Fendrich 1988) и вид Paracoccus halodenitrificans (Robinson and Gibbons 1952) были объединены в один род Halomonas, а род Zymobacter был помещен в семейство Halomonadaceae. Название происходит от латинского существительного venusta, что означает "прекрасный" или "красивый". Первоначально он был выделен из морской воды с Гавайских островов.

Halomonas venusta обладает высокой устойчивостью к соли, температуре и низкой влажности, что делает ее адаптированной к экстремальным условиям. Эти свойства делают ее важной для биотехнологических исследований, а также для применения в области биоремедиации загрязненных водных систем. Исследования показали, что Halomonas venusta может синтезировать различные полезные метаболиты. Она способна производить ферменты, которые могут быть использованы в промышленности, а также антиоксиданты и антибиотики, имеющие потенциальное медицинское предназначение. Благодаря своей способности к адаптации к экстремальным условиям, Halomonas venusta может играть важную роль в исследованиях в области биотехнологии и медицины. Ее потенциал для использования в промышленности и в медицинских приложениях делает ее объектом интереса для будущих исследований.

Царство: Bacteria

Тип: Pseudomonadota

Класс: Gammaproteobacteria

Семейство: Halomonadaceae

Род: Halomonas

Вид: Halomonas venusta


map
Рис. 1. Места обнаружения Halomonas venusta [2]

Материалы и методы

Для написания мини-обзора были использованы файлы с последовательностью генома и таблица особенностей бактерии Halomonas venusta из базы NCBI. Расчеты статистических данных о белках были выполнены с помощью электронной таблицы Google Sheets. Использовалась сборка Halomonas venusta ASM1685937v1 https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_016859375.1/

Результаты и обсуждение

С помощью электронной таблицы Google Sheets были построены:

Гистограмма длин межгенных промежутков (лист inter_cds_intervals-hist) (см. Рис. 3.);

Таблица распределения генов белков и разных типов рнк по репликонам (лист per-replicones) (см. Таблица 1.);

Диаграмма соотношения разных типов РНК (лист RNAs)

Таблица анализа соседних CDS (лист neirbouring-cds) (см. Таблица 2.).


Распределение длин белков

В целом, у Halomonas venusta белки имеют длину от 23 до 5170 аминокислот, а среднее значение составляет 333 аминокислоты. Исходя из гистограммы можно утверждать, что в геноме преобладают белки длиной 50-500 аминокислот.

Гистограмма распределения длин белков (лист protein_length-hist) (см. Рис. 2.)

protein
Рис. 2. Гистограмма длин белков Вертикальная ось – количество белков, горизонтальная ось – длина белков.

Распределение генов по репликонам

Для каждого репликона было подсчитано количество генов, кодирующих белки и разные РНК. (см. Таблица 1.). Нетрудно подсчитать, что всего генов у данной бактерии 3892 (3883 на главной хромосоме и всего лишь 9 на плазмиде).

Как видно, рРНК 18 типов, рРНК 60 типов, тмРНК 1 тип. Имеются также 3 малые некодирующие РНК.

genomic_accession seq_type CDS ncRNA rRNA tRNA tmRNA
NZ_CP066539.1 chromosome 3801 3 18 60 1
NZ_CP066540.1 plasmid 9 0 0 0 0
Таблица 1. Распределение генов белков и разных типов РНК по репликонам

Длины межгенных промежутков

Существуют отрицательные значения межгенных промежутков. Это говорит о том, что в этих местах гены накладываются друг на друга (перекрываются). По графикам можно сделать следующие выводы:

1) Наибольшее количество генов находятся друг от друга на расстоянии 0-100 нуклеотидов;

2) Большое число генов накладываются друг на друга.

map
Рис. 3. Гистограмма длины межгенных промежутков

Анализ соседних CDS

Кодирующая последовательность (CDS) – основная структурно-функциональная единица гена, именно в ней находятся триплеты нуклеотидов, кодирующие аминокислотную последовательность. Следовательно, межгенные промежутки - участки, не кодирующие гены (не имеют информационной важности). Для удобства и большей ясности гистограммы отдельно “+” и “-” цепей (прямая и обратная/комплементарная соответственно)

CDS на плюс цепи CDS на минус цепи
downstream CDS на плюс-цепи 545 350
downstream CDS на минус-цепи 350 587
Таблица 2. Анализ соседних CDS

Сопроводительные материалы

Google-таблица с геномом “minireview”

https://docs.google.com/spreadsheets/d/
1CZnbfTc3kkneE_SxwR_NdOTyPar5833aLWDPVArLz7Q

Список литературы

Статья в Википедии “Halomonas Venusta” https://en.wikipedia.org/wiki/Halomonas_venusta

[2] Halomonas venusta strain information https://bacdive.dsmz.de/strain/6019

NCBI general information: articles, genome: https://www.ncbi.nlm.nih.gov/search/all/?term=halomonas%20venusta&sp=c