Особенности генома и протеома Bacillus velezensis.
Максим Козлов (101 группа)
Факультет биоинженерии и биоинформатики Московского Государственного Университета им М. В. Ломоносова.
*makozlov2005@gmail.com
Резюме:
В мини-обзоре приведены общие сведения о геноме и протеоме Bacillus velezensis: рассчитаны длины белков и частота их встречаемости, изучено число аминокислотных остатков, рассчитаны расстояния между последовательными кодирующими последовательностями и число GC-последовательностей.
Введение
Bacillus velezensis — аэробная, грамположительная, формирующая эндоспоры свободноживущая почвенная бактерия. Bacillus velezensis играет важную роль в производстве биоактивных натуральных продуктов с потенциальным сельскохозяйственным и медицинским применением. Три семейства липопептидов, продуцируемых Bacillus spp., наиболее известны своей антагонистической активностью против других микробов, то есть фенгицина, итурина и сурфактина. Новый штамм NST6 был выделен из почвы и идентифицирован как B. velezensis на основе филогеномного анализа. Анализ генома выявил 21 предполагаемый биосинтетический кластер генов, включая те, которые отвечают за выработку бацилломицина и сурфактина[4]. Таксономическая принадлежность: cellular organisms; Bacteria; Terrabacteria group; Bacillota; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus subtilis group; Bacillus amyloliquefaciens group; Bacillus velezensis (Источник: таксономия Bacillus velezensis (NCBI: Taxonomy browser (Bacillus velensis A3)).
Материалы и методы
Общая информация о геноме и протеоме была взята с сайта NCBI (https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/769/555/GCF_000769555.1_ASM76955v1/). Взятые файлы: GCF_000769555.1_ASM76955v1_feature_table.txt.gz
и GCF_000769555.1_ASM76955v1_protein.faa.gz. Данные о геноме и протеоме были обработаны при помощи Гугл таблиц (Google Sheets).
Длины белков, частота их встречаемости, число аминокислотных остатков продемонстрированы на диаграммах (выполнены также в Google Sheets).
Процентное содержание GC-последовательностей было подсчитано с помощью скрипта Python
Результаты
- Общие сведения:
Геном Bacillus velezensis представлен одной хромосомой длина которой составляет 4005658 нуклеотидов, кодирующих 3926 генов (из них 126 находятся в РНК) и плазмидой pBMJS25R (7 генов).
https://www.ncbi.nlm.nih.gov/genome/?term=txid492670[orgn]&shouldredirect=false
Таблица 1. Типы генов Bacillus velezensis
|
Количество генов |
Всего |
4260 |
РНК |
126 |
- Длины белков и частота их встречаемости:
Как видно из рисунка 1 протеом бактерии Bacillus velezensis преимущественно представлен белками длиной от 100 до 150 аминокислот и от 250 до 300 аминокислот, что является вполне обычным для бактерий, ведь, как правило, длина белка составляет от 200 до 300-400 аминокислот[1].
Медианная длина белков Bacillus velezensis составляет 450 аминокислотных остатков.
Не менее интересные результаты демонстрирует и таблица 2, в которой представлены названия и размеры самых крупных белков.
Таблица 2. Величина самых длинных белков Bacillus velezensis
Таблица 1. Типы генов Bacillus velezensis
Кодовое название белка |
Название |
Длина(число аминокислот) |
WP_022553860.1 |
non-ribosomal peptide synthetase |
5700 |
WP_022553318.1 |
non-ribosomal peptide synthetase |
5433 |
WP_022553269.1 |
bacillomycin D non-ribosomal peptide synthetase BamB |
5363 |
Как видно из таблицы 2 в протеоме Bacillus velezensis (помимо белков длиной в несколько сотен аминокислот) содержатся белки, достигающие в длину более 5 тысяч аминокислот. Самым крупными являются белки с кодами WP_022553860.1 и WP_022553318.1 (5700 и 5433 аминокислот соответственно). Они являются нерибосомальными пептидосинтазами (крупные мультимодульные молекулы, способные производить белки независимо от рибосомы). Многие из них обладают антибактериальными и противогрибковыми свойствами, из-за чего используются в медицине [5]. Третий по величине белок WP_022553269.1 также является противогрибковым (противогрибковый липопептид бацилломицин D) [6].
Расстояния между последовательными кодирующими последовательностями:
Кодирующие последовательности в геноме Bacillus velezensis находятся достаточно плотно относительно друг друга (у большинства промежуток составляет от 0 до 99 и от 100 до 199 пар нуклеотидов), что наглядно демонстрирует рисунок 2.
Учитывая то, что нуклеоид бактерии по массе на 80% состоит из ДНК [1], то преобладание таких относительно небольших промежутков неудивительно.
Гены РНК:
В геноме Bacillus velezensis хранится 126 генов (из них в тРНК 91 ген, в рибосомальной-30, прочие-5) https://www.ncbi.nlm.nih.gov/genome/?term=txid492670[orgn]&shouldredirect=false
Подсчет количества GC-последовательностей
Количество разных нуклеотидов образующих ДНК было подсчитано при помощи скрипта в Pythonскрипта в Python. Всего в геноме содержится 4 014 440 нуклеотидов. Как видно из таблицы 3, 46% из них составляет гуанин и цитозин.
Таблица 2. Величина самых длинных белков Bacillus velezensis
Таблица 1. Типы генов Bacillus velezensis
Нуклеотид |
A |
G |
C |
T |
Количество(ед) |
1074565 |
930149 |
932186 |
1077540 |
Доля(%) |
27 |
23 |
23 |
27 |
Обсуждение и выводы:
Исходя из того, что самые длинные белки бактерии имеют антибактериальные и противогрибковые свойства (из-за чего используются в медицине для производства антибиотиков [2]) можно предположить, что Bacillus velezensis, живя в почве, может использовать их для уничтожения конкурентов(мицелия, других почвенных бактерий).
Учитывая то, что 46% генома занимают GC-последовательности(таблица 3) можно сделать вывод что ДНК бактерии достаточна устойчива к внешним воздействиям, ведь между G и C существует 3 водородные связи вместо 2(как между А и Т). [1]
Большинство промежутков (рисунок 2) между кодирующими последовательностями не превышает 1000 пар нуклеотидов. В этих промежутках может располагаться регуляторная последовательность, занимающая определенную длину. Возможны и “пустыни” (участки хромосомы не несущие кодирующих последовательностей). [3]
Список литературы:
- [1] Гены по Льюину / Дж. Кребс, Э. Голдштейн, С. Килпатрик ; пер. 10-го англ. изд. — 3-е изд. — М. : Лаборатория знаний, 2020. — 919 с. : цв. ил. ISBN 978-5-00101-249-8
- [2] Нетрусов А.И., Котова И.Б. Микробиология 3-е изд., испр. — М.: Академия, 2009. — 352 с. — ISBN: 8-97609-4686-9
- [3] К. Линн, О. Реймонд, Л. Бенджамин - Клетки по Льюину. 2018
- [4] S.V.Kravchenko, D.V.Poshvina, A.V.Vasilchenko, A.S.Vasilchenko Draft Genome Sequence of the Multiple Antibiotic Producer Bacillus velezensis X-BIO-1
- [5] Strieker,M., Tanovic,A. and Marahiel,M.A. Nonribosomal peptide synthetases: structures and dynamics Curr Opin Struct Biol 20
- [6] Moyne,A.L., Cleveland,T.E. and Tuzun,S. Molecular characterization and analysis of the operon encoding the antifungal lipopeptide bacillomycin D FEMS Microbiol Lett 234