Краткий обзор генома бактерии Mycobacterium senriense

Введение

Mycobacterium senriense штамм TY59 - это медленно растущий вид грамм-положительных микобактерий с высоким содержанием GC, выделенный из мокроты пациента с хронической обструктивной болезнью легких с диагнозом пневмония в Японии [2]. Первоначальный образец мокроты при микроскопии дал отрицательный результат мазка, но в течение 1 недели вырос в бульонной культуре. Mycobacterium senriense признана новым медленно растущим видом микобактерий. M. senriense хорошо растет при 37 и 40 °C (температура внутренней среды). Из-за роста заболеваемости нетуберкулезными микобактериальными инфекциями, необходимо выявлять новые виды микобактерий и направления их развития, чтобы пациентам с микобактериальными инфекциями предоставлялись правильные рекомендации и лечение [1].

Систематика : Царство Bacteria
Тип Actinomycetota
Класс Actinomycetia
Отряд Mycobacteriales
Семейство Mycobacteriaceae
Род Mycobacterium
Вид M. senriense

Материалы и методы

Информация о протеоме и нуклеотидной последовательности бактерии была получена из баз данных NCBI [3]. Вычислительные исследования на основе этих данных выполнялись с помощью приложения для работы с электронными таблицами Google Sheets и языка программирования Python 3, исполняемого в облачной среде Google Colab. 1. Подсчет количества белков определенной длины был осуществлен с помощью построения гистограммы в Google Sheets. 2. Определение количества РНК разных типов было осуществлено с помощью Google Sheets и фильтра. 3. Определение количества генов на прямой и обратной цепях было осуществлено с помощью Google Sheets и фильтра. 4. Частота встречаемости нуклеотидов в нуклеотидной последовательности и длина данной последовательности были определены с помощью скриптов Python 3.

Результаты

Распределение длин белков

Геном Mycobacterium senriense кодирует 5396 белков, причем 6 из них синтезируются с неопределенной последовательности (после секвенирования не получилось собрать в хромосому), а остальные с хромосомы. Длина белка варьируется от 26 до 1774 аминокислот. Средняя длина белка - 328 аминокислот, то есть преобладают белки меньшей длины. Также на гистограмме ясно выражены 2 скачка количества белков на участках длины 120-160 и 240-280. Весьма специфичное распределение белков для бактерии - белков длины 0-40 практически нет.

Распределение генов на прямой и обратной цепях

Были получены сведения о количестве генов на прямой и обратной цепях. Их количество различается незначительно - на прямой цепи находится 50.4% генов, а на обратной - 49.6%.

Распределение генов РНК в геноме

В геноме бактерии присутствует 52 гена, кодирующих РНК : транспортная РНК - 46 гена некодирующая РНК - 2 гена рибосомная РНК - 3 гена траспортно - матричная РНК - 1 ген Их значительно меньше, чем генов во всей бактерии (8102 генов).

Нуклеотидный состав ДНК

Общая длина генома составляет 5831457 пар нуклеотидных оснований, распределенных между кольцевой хромосомой и неопределенной последовательностью. С помощью программы по анализу нуклеотидного состава последовательности был определен процентный нуклеотидный состав Mycobacterium senriense штамм TY59. GC-состав всего генома - 67.07% A = 16.44%, T = 16.49%, G = 33.54%, C = 33.53%. Как видно из процентного соотношения, второе правило Чаргаффа подтверждается - содержание аденина приблизительно равно содержанию тимина, также, как и содержание цитозина сходится с содержанием гуанина.

Сопроводительные материалы

1)Таблица геномных особенностей из NCBI https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/01 9/668/465/GCF_019668465.1_ASM1966846v1/ GCF_019668465.1_ASM1966846v1_feature_tab le.txt.gz
2)Нуклеотидная последовательность бактерии из NCBI в формате FASTA:https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/01 9/668/465/GCF_019668465.1_ASM1966846v1/ GCF_019668465.1_ASM1966846v1_genomic.f na.gz
3)Геномная таблица особенностей (в том числе таблица РНК, белков и гистограмма длин белков)kondratuk_genome
4)Скрипт для определения длины нуклеотидной последовательности и ее состава :sequence_minireport.ipynb

Благодарности

Приносятся благодарности преподавательскому составу курса практической биоинформатики 2023 года факультета биоинженерии и биоинформатике за достойное обучение в течение семестра и предоставленные материалы и методы для написания краткого обзора генома бактерии.

Литература и дополнительные источники

[1]ASM Journals,Journal of Clinical Microbiology, Vol. 61, No. 4, A Brief Update on Mycobacterial Taxonomy, 2020 to 2022 Authors: Derek T. Armstrong, Emma Eisemann, Nicole Parrish
[2]Int J Syst Evol Microbiol. 2022 May;72(5). doi: 10.1099/ijsem.0.005378.