• Главная страница
  • Обо мне
  • Семестры
  • Сайт ФББ

Особенности генома и протеома Bacillus velezensis.

Максим Козлов (101 группа)

Факультет биоинженерии и биоинформатики Московского Государственного Университета им М. В. Ломоносова.

*makozlov2005@gmail.com

Резюме:

В мини-обзоре приведены общие сведения о геноме и протеоме Bacillus velezensis: рассчитаны длины белков и частота их встречаемости, изучено число аминокислотных остатков, рассчитаны расстояния между последовательными кодирующими последовательностями и число GC-последовательностей.

Введение

Bacillus velezensis — аэробная, грамположительная, формирующая эндоспоры свободноживущая почвенная бактерия. Bacillus velezensis играет важную роль в производстве биоактивных натуральных продуктов с потенциальным сельскохозяйственным и медицинским применением. Три семейства липопептидов, продуцируемых Bacillus spp., наиболее известны своей антагонистической активностью против других микробов, то есть фенгицина, итурина и сурфактина. Новый штамм NST6 был выделен из почвы и идентифицирован как B. velezensis на основе филогеномного анализа. Анализ генома выявил 21 предполагаемый биосинтетический кластер генов, включая те, которые отвечают за выработку бацилломицина и сурфактина[4]. Таксономическая принадлежность: cellular organisms; Bacteria; Terrabacteria group; Bacillota; Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus subtilis group; Bacillus amyloliquefaciens group; Bacillus velezensis (Источник: таксономия Bacillus velezensis (NCBI: Taxonomy browser (Bacillus velensis A3)).

Материалы и методы

Общая информация о геноме и протеоме была взята с сайта NCBI (https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/769/555/GCF_000769555.1_ASM76955v1/). Взятые файлы: GCF_000769555.1_ASM76955v1_feature_table.txt.gz и GCF_000769555.1_ASM76955v1_protein.faa.gz. Данные о геноме и протеоме были обработаны при помощи Гугл таблиц (Google Sheets). Длины белков, частота их встречаемости, число аминокислотных остатков продемонстрированы на диаграммах (выполнены также в Google Sheets). Процентное содержание GC-последовательностей было подсчитано с помощью скрипта Python

Результаты

  • Общие сведения:

    Геном Bacillus velezensis представлен одной хромосомой длина которой составляет 4005658 нуклеотидов, кодирующих 3926 генов (из них 126 находятся в РНК) и плазмидой pBMJS25R (7 генов). https://www.ncbi.nlm.nih.gov/genome/?term=txid492670[orgn]&shouldredirect=false

    Таблица 1. Типы генов Bacillus velezensis

    Количество генов
    Всего 4260
    РНК 126

  • Длины белков и частота их встречаемости:

    Как видно из рисунка 1 протеом бактерии Bacillus velezensis преимущественно представлен белками длиной от 100 до 150 аминокислот и от 250 до 300 аминокислот, что является вполне обычным для бактерий, ведь, как правило, длина белка составляет от 200 до 300-400 аминокислот[1].

    picture_1
    Рисунок 1. Гистограмма длин белков

    Медианная длина белков Bacillus velezensis составляет 450 аминокислотных остатков. Не менее интересные результаты демонстрирует и таблица 2, в которой представлены названия и размеры самых крупных белков.

    Таблица 2. Величина самых длинных белков Bacillus velezensis Таблица 1. Типы генов Bacillus velezensis

    Кодовое название белка Название Длина(число аминокислот)
    WP_022553860.1 non-ribosomal peptide synthetase 5700
    WP_022553318.1 non-ribosomal peptide synthetase 5433
    WP_022553269.1 bacillomycin D non-ribosomal peptide synthetase BamB 5363

    Как видно из таблицы 2 в протеоме Bacillus velezensis (помимо белков длиной в несколько сотен аминокислот) содержатся белки, достигающие в длину более 5 тысяч аминокислот. Самым крупными являются белки с кодами WP_022553860.1 и WP_022553318.1 (5700 и 5433 аминокислот соответственно). Они являются нерибосомальными пептидосинтазами (крупные мультимодульные молекулы, способные производить белки независимо от рибосомы). Многие из них обладают антибактериальными и противогрибковыми свойствами, из-за чего используются в медицине [5]. Третий по величине белок WP_022553269.1 также является противогрибковым (противогрибковый липопептид бацилломицин D) [6].

  • Расстояния между последовательными кодирующими последовательностями:

    Кодирующие последовательности в геноме Bacillus velezensis находятся достаточно плотно относительно друг друга (у большинства промежуток составляет от 0 до 99 и от 100 до 199 пар нуклеотидов), что наглядно демонстрирует рисунок 2.

    picture_2
    Рисунок 2. Гистограмма расстояний между кодирующими последовательностями

    Учитывая то, что нуклеоид бактерии по массе на 80% состоит из ДНК [1], то преобладание таких относительно небольших промежутков неудивительно.

  • Гены РНК:

    В геноме Bacillus velezensis хранится 126 генов (из них в тРНК 91 ген, в рибосомальной-30, прочие-5) https://www.ncbi.nlm.nih.gov/genome/?term=txid492670[orgn]&shouldredirect=false

    picture_1
    Рисунок 3. Расположение генов в РНК
  • Подсчет количества GC-последовательностей

    Количество разных нуклеотидов образующих ДНК было подсчитано при помощи скрипта в Pythonскрипта в Python. Всего в геноме содержится 4 014 440 нуклеотидов. Как видно из таблицы 3, 46% из них составляет гуанин и цитозин.

    Таблица 2. Величина самых длинных белков Bacillus velezensis Таблица 1. Типы генов Bacillus velezensis

    Нуклеотид A G C T
    Количество(ед) 1074565 930149 932186 1077540
    Доля(%) 27 23 23 27

Обсуждение и выводы:

Исходя из того, что самые длинные белки бактерии имеют антибактериальные и противогрибковые свойства (из-за чего используются в медицине для производства антибиотиков [2]) можно предположить, что Bacillus velezensis, живя в почве, может использовать их для уничтожения конкурентов(мицелия, других почвенных бактерий). Учитывая то, что 46% генома занимают GC-последовательности(таблица 3) можно сделать вывод что ДНК бактерии достаточна устойчива к внешним воздействиям, ведь между G и C существует 3 водородные связи вместо 2(как между А и Т). [1] Большинство промежутков (рисунок 2) между кодирующими последовательностями не превышает 1000 пар нуклеотидов. В этих промежутках может располагаться регуляторная последовательность, занимающая определенную длину. Возможны и “пустыни” (участки хромосомы не несущие кодирующих последовательностей). [3]

Список литературы:

  • [1] Гены по Льюину / Дж. Кребс, Э. Голдштейн, С. Килпатрик ; пер. 10-го англ. изд. — 3-е изд. — М. : Лаборатория знаний, 2020. — 919 с. : цв. ил. ISBN 978-5-00101-249-8
  • [2] Нетрусов А.И., Котова И.Б. Микробиология 3-е изд., испр. — М.: Академия, 2009. — 352 с. — ISBN: 8-97609-4686-9
  • [3] К. Линн, О. Реймонд, Л. Бенджамин - Клетки по Льюину. 2018
  • [4] S.V.Kravchenko, D.V.Poshvina, A.V.Vasilchenko, A.S.Vasilchenko Draft Genome Sequence of the Multiple Antibiotic Producer Bacillus velezensis X-BIO-1
  • [5] Strieker,M., Tanovic,A. and Marahiel,M.A. Nonribosomal peptide synthetases: structures and dynamics Curr Opin Struct Biol 20
  • [6] Moyne,A.L., Cleveland,T.E. and Tuzun,S. Molecular characterization and analysis of the operon encoding the antifungal lipopeptide bacillomycin D FEMS Microbiol Lett 234