Мини-обзор генома и протеома бактерии Natrinema salinisoli

Резюме

Представленный мини-обзор на геном и протеом галофильной ахреи Natrinema salinisoli выполнен с использованием инструментов электронных таблиц и функционала интерпретатора командной строки Bash. Данные полученные при обработке объясняются биоинформатическими закономерностями.

1. Введение

Natrinema salinisoli - галофильная архея рода Natrinema. Выделена из проб особо засоленных территорий, таких как соляная шахта, соленое озеро и засоленные почвы. (Bao CX et al. (2022)) [1]. В мини-обзоре используются данные о геноме и протеоме, взятые из открытых баз данных, приводятся статистические исследования нуклеотидного состава генома, анализируется количественное содержание кодирующих последовательностей различных типов. Изучение особенностей данного микроорганизма потенциально даст возможность его использования в практических целях. Практическое применение галофильных микроорганизмов имеет огромный спект. Ниже приведены потенциальные направления применения таких организмов. Известны случаи использования галофильных микроорганизмов в целях частичной рекультивации засоленных почв для их дальнейшего использования в сельскохозяйственных нуждах [2]. С другой стороны в частности галофильные археи нашли место в биоремедиации тяжелых металлов и синтеза наночастиц в засоленных водоемах [3]. В настоящем мини-обзоре рассматриваются и анализируются стандартные данные о геноме и протеоме Natrinema salinisoli и приводятся статистические данные.

2. Материалы и методы

Используемые в работе данные о геноме были взяты с сайта Национального центра биотехнологической информации (NCBI) (1). Для обработки данных был использован функционал электронных таблиц Google sheets (2).

3. Результаты

3.1. Описание стандартных данных о геноме

Геном Natrinema salinisoli состоит из 1 кольцевой хромосомы и двух кольцевых плазмид: unnamed1, unnamed2.

Таблица 1. Стандартные данные о геноме
ДНК Длинна
Хромосома 4190309
Плазмида unnamed1 400082
Плазмида unnamed2 113814
3.2. Статистические данные о содержании кодируемых элементов

С помощью электронных таблиц было проанализировано содержание различных типов элементов на хромосоме и плазмидах. Данные представлены на листе per-replicones электронной таблицы.

Таблица 2. Данные о кодируемых элементах
seq_type chromosome CDS rRNA tRNA ncRNA
chromosome 4105 10 0 2
plasmid unnamed1 114 0 0 0
plasmid unnamed2 399 0 51 0

В процессе статистической обработки было выявлено наличие таких видов кодируемых элементов как: CDS (coding sequences - кодирующие последовательности), rRNA (рибосомальные РНК), tRNA (транспортные РНК), ncRNA (некодирующие РНК). По результатам обработки было замечено характерное расположение элементов генома, кодирующих транспортные РНК. Причиной такого распределения элементов мог послужить процесс новообразования хромосом, который имеет место у прочих организмов.

1
Диаграмма 1. Гистограмма длин аминокислотных последовательностей
3.4. Расстояния между соседними кодирующими последовательностями на + цепи генома

С помощью электронных таблиц было оценено расстояние между соседними кодирующими элементами путем сравнения координат начала и конца соответствующих соседних последовательностей. Данные обработки представлены на Диаграмме 2. (Примечание: отрицательные значения в расстояниях указывают на перекрывания соседних кодирующих элементов)

2
Диаграмма 2. Гистограмма расстояний между соседними кодирующими последовательностями на + цепи
3.5 Длинна общих участков перекрывающихся последовательностей

При обработке данных п. 3.4 отмечено наличие перекрывающихся участков у соседних кодирующих последовательностей. С помощью инструментов электронных таблиц были рассчитаны значения длин перекрывания таких последовательностей (лист intersecting_cds-hist). Данные расчетов представлены в диаграмме 3.

3
Диаграмма 4. Частоты встречаемости различных старт-кодонов

По представленным данным можно однозначно установить, что абсолютное большинство старт кодонов имеют нуклеотидный вид ATG. Однако было обнаружено и присутствие относительно многочисленной замены одного пуринового основания на другое, а именно, аденин → гуанин.

3.7. Частоты встречаемости различных стоп-кодонов

Аналогично п. 3.6 было рассчитано количество различных стоп-кодонов кодирующих последовательностей. Результаты представлены на Диаграмме 5.

4
Диаграмма 5. Частоты встречаемости различных стоп-кодонов

Таким образом, наиболее часто встречаемый стоп кодон - кодон TAA, однако в единичных сдучаях имеют место быть и стоп кодоны прочего состав. Это явление может быть обосновано погрешностями секвенирования, в силу пока малой изученности данного организма.

4. Сопроводительные материалы

1. Электронная таблица
https://docs.google.com/spreadsheets/d/1r2ch4MfdfQvW

5. Список литературы

[1] Natrinema halophilum sp. nov., Natrinema salinisoli sp. nov., Natrinema amylolyticum sp. nov. and Haloterrigena alkaliphila sp. nov., four extremely halophilic archaea isolated from salt mine, saline soil and salt lake Chen-Xi Bao1, Si-Ya Li1, Yu-Jie Xin1, Jing Hou1, Heng-Lin Cui, 26 May 2022, International Journal of systematic and evolutionary microbiology, volume 72, issue 5

https://www.microbiologyresearch.org/content

[2] Salt-Tolerant Plant Growth Promoting Rhizobacteria for Enhancing Crop Productivity of Saline Soils, Dilfuza Egamberdieva et al. Front Microbiol. 2019

https://pubmed.ncbi.nlm.nih.gov/31921005/

[3] Выделение и характеристика галофильных бактерий, обладающих способностью к биоремедиации тяжелых металлов и синтезу наночастиц, из соленого озера Хара в Иране. Диба Х., Кохан Р.А., Салимиан М. и др. (2021), Arch Microbiol 203: 3893-3903

https://doi.org/10.1007/s00203-021-02380-w