Мини-обзор генома бактерии Paenibacillus durus

Автор: Степанова Софья Михайловна

Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова, Москва; stepanova.sofia@fbb.msu.ru

Резюме

Данная статья содержит краткий обзор генома и протеома Paenibacillus durus с использованием биоинформатического пакета EMBOSS, программирования на языке Python и функционала электронных таблиц. Описан геном бактерии, GС-состав плазмиды и хромосомы, нуклеотидный состав геномных ДНК, проанализированы длины белков, их распределение белок-кодирующих генов, представлены данные о рибосомальных, гипотетических и транспортных белках и данные об РНК бактерии.

1 Введение

Бактерия Paenibacillus durus выделенна из повы и корней различных растений [5].

Медицинское значение. Виды Paenibacillus описаны как "золотая жила кандидатов в антибиотики" [3]. Paenibacillus производят широкий спектр липопептидов, из которых можно разработать антибактериальные, противогрибковые, противораковые и противовирусные препаратов. Также известно, что развитие антибиотикорезистентности к липопептидам происходит гораздо медленнее. Помимо липопептидов, Paenibacillus также производят два из трех типов бактериоцинов [4]. А некоторые исследования показывают, что их экзополисахариды имеют потенциал в качестве антиоксидантов, противоопухолевых препаратов и, возможно, даже профилактических средств против кариеса.

Сельскохозяйственное значение. Многие виды производят противогрибковые препараты и инсектициды, которые защищают растения от патогенов и насекомых-травоядных[2]. Они также могут стимулировать собственные механизмы сопротивления растений. Некоторые виды производят ферменты, которые убивают личинок жуков.. Кроме того, известно, что они способствуют росту культур посредством фиксации азота, солюбилизации фосфатов и усвоения железа. Исследования показывают, что Paenibacillus могут быть использованы в качестве менее дорогого и более экологически чистого удобрения, чем многие из используемых сегодня химических фосфорных удобрений [1].

Промышленное значение. Хотя в настоящее время Paenibacillus не используется ни в одной отрасли промышленности, некоторые виды Paenibacillus производят ферменты, которые могут быть использованы в производстве моющих средств, биотоплива, бумаги, текстиля и продуктов питания [1]. Их потенциальная польза как более стабильного, более продуктивного и менее дорогого источника ферментов для промышленного применения остается неизученной.

2 Материалы и Методы

Данные бактерии взяты и с сайта NCBI [3]. Анализ данных проводился с помощью электронной таблицы Google Sheets [5], электронной таблицы Excel [8] и программы на языке Python [4]. Хромосомная таблица[1], последовательность генома [2].

3 Результаты

3.1 Описание генома бактерии
Геном Paenibacillus durus содержит безымянную кольцевую плазмиду(15151 п.н.) и одну хромосому(6038347 п.н.) [6]. В хромосоме GC составляет 50,8%, а в плазмиде 49,05%.
Таблица 1. Стандартные данные о геноме
ДНК Длина (п.н.) GC состав
Хромосома 6038347 50,8 %
Плазмида 15151 49,05%

В Таблице 2 представлен нуклеотидный состав ДНК. Можно заметить, что число адениловых оснований примерно равно числу тиминовых (1485270 и 1492462 соответственно), а число гуаниловых примерно равно цитозиновых (1545693 и 1530073 соответственно) в геноме, то есть выполняется второе правило Чаргаффа[7].

Таблица 2. Нуклеотидный состав геномных ДНК
ДНК A T G C
Хромосома 148172 1488287 1542335 1525999
Плазмида 3544 4175 3358 4074
Всего 1485270 1492462 1545693 1530073

На рис. 1 представлен график cumulative GC-skew нуклеотидной последовательности хромосомы Paenibacillus durus . Известно, что минимум соответствует местоположению начальной точки репликации, а максимум - местоположению конечной точки репликации в прокариотическом геноме.

изображение не загрузилось
Рис. 1. Сumulative GC-skew хромосомы Paenibacillus durus
3.2 Статистические данные о белках протеома

Распределение длин белков показано на гистограмме на рис. 2.

изображение не загрузилось
Рис. 2. Гистограмма длин белков Paenibacillus durus
Таблица 3. Статистические параметры распределения длин белков
Средняя длина 326
Среднее квадратичное отклонение 314
Медиана 274
Минимальное значение 16
Максимальное значение 6649

С помощью электронных таблиц [8, таблица GC, лист “+и-”] было установлено распределение белок-кодирующих генов по цепям ДНК (Таблица 4). По статистической значимости мы можем сделать вывод, что гены по цепям распределяются случайно (уровень значимости >0.01).

Анализ количества и процентные содержания таких групп белков: рибосомальные, гипотетические и транспортные – по данным таблицы особенностей генома [8,таблица “таблицы генома,белков и рнк.txt”, лист “анализ белков” ]представлен в таблице 5.

Таблица 4. Распределение белок-кодирующих генов
ДНК «+» цепь «-» цепь Статистическая значимость
Хромосома 2516 2694 0,014191142
Плазмида 0 29 -
3.3 Статистические данные о генах РНК

Всего в геноме 114 генов РНК [8, таблица “таблицы генома,белков и рнк.txt”, лист “RNA”]. Генов тРНК – 83, рРНК – 27 (Таблица 6). В геноме представлено 9 генов типа 23S рРНК, 9 генов 16S рРНК и 9 гнов 5S, все они образуют основу рибосом прокариот.

Таблица 5. Данные о белках избранных групп
Белки Количество Процент от всех белков
Рибосомальные белки 60 2.13 %
Гипотетические белки 839 29.72 %
Транспортные белки 97 3.44 %

Сопроводительные материалы

1. Хромосомная таблица: https://drive.google.com/file/d/1NENdzbpE78fSvDwHAOgw7Ph4BqRVVSvi/view?usp=sharing

2. Последовательность генома https://drive.google.com/file/d/1qy8Sbx9fDO6q3-0KM29TkxZdCiUccBD0/view?usp=sharing

3. Данные NCBI по геному бактерии https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/756/615/GCF_000756615.1_ASM75661v1/

4. Программа, написанная на Python https://colab.research.google.com/drive/1Ej2GhWzWLlluI8Uh-YxKrUGlxrnRZAXE?usp=sharing

5. Таблица Google Sheets

6. https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/756/615/GCF_000756615.1_ASM75661v1/GCF_000756615.1_ASM75661v1_assembly_stats.txt

7. https://fundamental-research.ru/ru/article/view?id=36257

8. Таблицы Excel таблицы генома,белков и рнк.xlsmGC.xlsx

Список литературы

1 Farah Ahmad, Iqbal Ahmad, Mohd. Musheer Altaf, Mohd.Saghir Khan, Yogesh S. Shouche (2016) Characterization of Paenibacillus durus (pnf16) a new isolate and its synergistic interaction with other isolated rhizobacteria in promoting growth and yield of chickpea. doi: 10.15414/jmbfs.2016.5.4.345-350

2 Cochrane, SA., Vederas, JC., “Lipopeptides from Bacillus and Paenibacillus spp.: A Gold Mind of Antibiotic Candidates.” “Medicinal Research Reviews” 2016. Volume 36. P. 4-31.

3 Grady, E., MacDonald, J., Liu, L., Richman, A., Yuan, Z. “Current knowledge and perspectives of Paenibacillus: a review”. “Microbial Cell Factories”. 2016. Volume 15. P 203.

4 Kobayashi, K., Kanesaki Y., Yoshikawa H., “Genetic Analysis of Collective Motility of Paenibacillus sp.” . “PLOS Genetics”. October 2016.

5 Priest, F., “Paenibacillus”. “Bergey’s Manual of Systematics of Archaea and Bacteria”. September 2015.DOI:10.1002/9781118960608.gbm00186

6 ​​Гребнев Я.В., Садовский М.Г. ВТОРОЕ ПРАВИЛО ЧАРГАФФА И СИММЕТРИЯ ГЕНОМОВ // Фундаментальные исследования. – 2014. – № 12-5. – С. 965-968.

Tаблица 6. Данные о РНК избранных групп
РНК Количество Процент от всех РНК
тРНК 83 72,8 %
рРНК 27 23,7%