Мини-обзор генома и протеома Salmonella enterica subsp. enterica serovar Typhimurium str. LT2


Введение

Классификация:

Домен: Бактерия

Тип: Протеобактерия

Класс: Гамма – протеобактерия

Порядок: Enterobacterales

Семейство: Энтеробактерии

Род: Сальмонеллы

Вид: Salmonella enteric

Международное научное название: Salmonella enterica (ex Kauffmann and Edwards 1952) Le Minor and Popoff 1987 [1]

Salmonella Typhimurium - вид палочковидных грамотрицательных факультативно-анаэробных жгутиковых бактерий, являются важными с медицинской точки зрения патогеном как для людей, так и для животных. В названии присутствует видовой эпитет Typhimurium, означающий сыпной тиф мыши. Эта бактерия вызывает у мышей болезнь, похожую на тиф. Но является менее серьезным патогеном для человека, хотя вызывает распространенные пищевые кишечные инфекции. С биохимической точки она интересна тем, что образует кислоту и газ из глюкозы – S, а также продуцирует сероводород [4], [5].


Материалы и Методы

Информация по геному бактерии была взята с сайта NCBI [1] (Национального Центра Биотехнологической Информации). Для анализа всех данных использовались Google Table (файл 1, 2). Все расчеты представлены в Google Sheets (файл 1). Расчеты в пункте 3.3 были сделаны на основе того, что общее количество RNA составляет 118, отталкиваясь от этого, мы подсчитали процентное содержание tRNA и rRNA (все расчеты представлены в Google таблице, в разделе вспомогательные расчеты).


Результаты

Описание стандартных данных о геноме

Геном данной бактерии содержит 1 кольцевую хромосому и 1 кольцевую плазмиду pSLT [3]. В таблице 1 приведены длина хромосомы и плазмиды, а так же GC состав в них. Можно заметить, что GC состав достаточно высокий (>51%), это можно связать со свойством устойчивости этой бактерии к противомикробным препаратам.

Таблица 1. Стандартные данные о геноме
ДНК Длина (п.н) GC состав
Рибосомальные белки 4857450 52 %
Плазмида pSLT 93933 53 %

Статистические данные о белках протенома

В данном разделе мы исследуем количество и процентное содержание разных групп белков, таких как: рибосомальные, гипотетические и транспортные. Рассмотрев внимательно таблицу Рибосомальных белков (файл 1), можно заметить уникальную рибосому bifunctional tRNA pseudouridine(32) synthase/ribosomal large subunit pseudouridine synthase RluA ( на данный момент, к сожалению, не могу сказать, в чем он участвует, но я в процессе разбирательства) [2], а так же ribosomal-protein-alanine N-acetyltransferase, которая является ферментом, катализирующем химические реакции [3]

Таблица 2. Данные о белках избранных групп
Белки Количество Процент от всех белков
Рибосомальные белки 71 1.56 %
Гипотетические белки 606 13.33 %
Транспортные белки 19 0.42 %

В Google Sheets мы проводили некоторые исследования, в которых строили гистограмму 1 длин белков, а так же считали некоторые параметры, указанные в таблице 3 (все значения взяты из Google Sheets Статистика (файл 2) )

Гистограмма длин белков
Диаграмма 1. Гистограмма длин белков
Таблица 3. Статистические параметры распределения длин белков
Средняя длина 314
Стандартное отклонение 223.62
Медиана 271
Минимальное значение 14
Максимальное значение 5559

На основе данных табдлицы CDS (файл 1), было установлено число генов белков, закодированных на прямой и комплементарной цепочк. Интересное наблюдение, что на хромосоме количество «+» цепи < количество «-» цепи, в то время, как на плазмиде все наоборот

Таблица 4. Распределение белок-кодирующих генов
ДНК «+» цепь «-» цепь
Хромосома 2129 2317
Плазмида pSLT 69 33
Всего 2198 2350

Статистические данные о генах РНК

Всего в геноме 118 РНК ( это составляет примерно 1.26% от всех генов), 85 тРНК и 22 рРНК (таблица 5). В своих расчетах rRNA я учитывал 5S, 16S, 23S рибосомальные РНК, а все тРНК я представила в Таблице tRNK (файл 1)

Таблица 5. Данные о РНК избранных групп
РНК Количество Процент от всех РНК
тРНК 85 72 %
рРНК 22 18.6 %

Дополнительные материалы

  • Данные NCBI по геному бактерии Salmonella enterica subsp. enterica serovar Typhimurium str. LT2
  • Google таблица с необходимыми файлами для анализа (файл 1)
  • Google таблица с необходимыми файлами для анализа (файл 2)

  • Ссылки на литературу

  • Ashari KS, Roslan NS, Omar AR, Bejo MH, Ideris A, Mat Isa N. 2019. Genome sequencing and analysis of Salmonella enterica subsp. enterica serovar Stanley UPM 517: Insights on its virulence-associated elements and their potentials as vaccine candidates. PeerJ 7:e6948
  • [2] Информация про bifunctional tRNA pseudouridine(32) synthase/ribosomal large subunit pseudouridine synthase RluA
  • [3] Информация про ribosomal-protein-alanine N-acetyltransferase
  • [4] Информация о бактерии на википедии
  • [5] Дополнительная информация о бактерии