Маслова К.Е.
Факультет Биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова, Москва, Россия
Мини-обзор содержит результаты исследования и описание некоторых особенностей генома и протеома (белков) бактерии Providencia rettgeri.
Providencia rettgeri - факультативно-анаэробная грамотрицательная палочковидная бактерия, относящаяся к семейству Enterobacteriaceae [2].
У P. rettgeri штаммы генетически разнообразны по сравнению с другими штаммами Providencia и отличаются от других штаммов из-за их свойства ферментировать маннит (разновидность сахарного спирта, используемого в качестве подсластителя и лекарства) и разлагать мочевину [1].
P. rettgeri может вызывать инфекции мочевыводящих путей и желудочно-кишечного тракта. Является основной причиной, вызывающей “диарею путешественников”. Основным путем передачи инфекции является прямой или косвенный контакт с зараженными людьми или предметами [3].
Организм также может вызывать глазные инфекции, такие как: кератит, конъюнктивит и эндофтальмит. Возможные факторы риска включают сопутствующие медицинские заболевания, включая инфекции мочевыводящих путей, недавние госпитализации и состояние с ослабленным иммунитетом [4].
В ходе работы были использованы данные о геноме бактерии Providencia rettgeri заимствованные из электронной базы данных NCBI [5].
Обработка данных производилась при помощи электронных таблиц Google Sheets и внутреннего функционала программы. Все исходные и промежуточные таблицы находятся на электронном ресурсе Google Sheets (S1).
На Рис. 1 приведена гистограмма расстояний между кодирующими последовательностями на плюс-цепи самой большой хромосомы бактерии Providencia rettgeri с интервалом в 5 нуклеотидов.
Самые распространенные интервалы находятся в диапазоне от 0 до 20 нуклеотидов, а среднее значение расстояний между кодирующими последовательностями составляет 120 нуклеотидов.
Среднее значение сильно отличается от самого распространенного из-за наличия большого количества интервалов особо крупного размера (до 500 нуклеотидов), такие расстояния примерно равномерно проранжированы в диапазоне от 140 до 500 нуклеотидов с тенденцией на уменьшение количества одинаковых интервалов, следовательно, кодирующие последовательности распределены по цепи неравномерно.
На диаграмме (Рис. 2) отображено полученное при помощи фильтров и функционала Google-таблиц (S1) распределение генов по прямой (+) и обратной (-) цепочкам ДНК.
Соотношение практически равное: 50,4% на прямой цепи и 49,6% на обратной, что может указывать на равную значимость обеих цепей при репликации, а также для процесса транскрипции.
На гистограмме длин белков прямой цепи (Рис. 3) видно, что длины белков у бактерии небольшие — до 2000 аминокислотных остатков. Средняя длина белка составляет 450 аминокислотных остатков, следовательно преобладают белки меньшей длины.
Во время анализа гистограммы возникает вопрос: как длина белка влияет на его возможности. Основываясь на вышеизложенных данных можно попробовать предположить, что белки не смогут составить сложных структур (например четвертичных) в силу своей длины.
Бактерия способна ферментировать маннит — разновидность сахарного спирта [1], следовательно, она синтезирует ферменты. Основываясь на данных рисунка 3, можно предположить, что ферменты, осуществляющие эту реакцию, имеют не очень сложную структуру в силу своей относительно небольшой длины.
Таблица 1 отображает количество белков и генов различных типов РНК для каждого репликона бактерии Providencia rettgeri, геном которой представлен одной хромосомой и одной плазмидой.
Seq_type | CDS | tRNA | rRNA | ncRNA | tmRNA |
---|---|---|---|---|---|
Хромосома | 3838 | 78 | 22 | 3 | 1 |
Плазмида | 175 | 0 | 0 | 0 | 0 |
В плазмиде содержится информация только о белках, причем их количество, закодированное в плазмиде, — это всего лишь 4,5% от числа белков, закодированных в хромосоме.
Интересно, что в хромосоме содержится информация только об одной транспортно-матричной РНК, что составляет меньше 0,9% только от количества РНК без учёта белков.
Если рассматривать РНК отдельно, то большее число генов отводится тРНК. Число кодирующих её генов составляет 75% от всех, отведенных под РНК. Далее идет рРНК — 21%, а затем некодирующая РНК — 2,8%.
S1. Google-таблицы исходные и промежуточные, а также результаты работы.