Учебный сайт
Яковлевой Марии

Вы находитесь на главной странице учебного сайта Яковлевой Марии.
Здесь будут выкладываться результаты практических работ по биоинформатике и не только :з

Мини-обзор генома и протеома бактерии Salmonella enterica subsp. enterica serovar Typhimurium str. LT2

Яковлева Мария Владимировна
Факультет Биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова, Москва, Россия

Контакты: yakovleva.marusya@yandex.ru.

1. Введение

Таксономическая принадлежность [1]:

Домен:

Bacteria

Филум:

Pseudomonadota

Класс:

Gammaproteobacteria

Отряд:

Enterobacterales

Семейство:

Enterobacteriaceae

Род:

Salmonella

Вид:

Salmonella enterica

Подвид:

Salmonella enterica subsp. enterica

Серотип:

Salmonella enterica subsp. enterica serovar Typhimurium str. LT2

Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 является серотипом подвида Salmonella enterica. Серотипы данного подвида определяют на основе их соматических (расположенных в клеточной стенке) и жгутиковых антигенов. Данная бактерия палочковидная, аэробная, грамотрицательная и имеет жгутики. В подвид S. enterica subsp. enterica входит большое количество серотипов, способных инфицировать разных позвоночных. Спектр хозяев S. enterica subsp. enterica serovar Typhimurium str. LT2 очень широк: люди, крупный рогатый скот, свиньи, овцы, лошади, грызуны, курообразные [2]. В данном мини-обзоре представлено описание генома и протеома Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.

2. Материалы и методы

Данные по геному и протеому Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 были взяты с сайта Национального Центра Биотехнологической информации (NCBI) [3]. Анализ данных и представление результатов в виде гистограмм и таблиц проводились с использованием электронных таблиц Google Sheets [1]. Для подсчета количества ячеек по определенному критерию была использована функция “COUNTIFS”.

3. Результаты

3.1 Разные типы закодированных в геноме последовательностей и их количество.

Геном Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 представляет собой одну хромосому и одну плазмиду(pSLT).

Таблица 1. Число генов белков и генов разных типов РНК для каждого репликона
# seq_type chromosome CDS rRNA tRNA ncRNA tmRNA misc_RNA
1 chromosome - 4452 22 / 85 / 9 / 1 0
2 plasmid pSLT 102 0 / 0 / 0 / 0 1

Было выявлено 6 типов кодирующих последовательностей: CDS (coding sequences - последовательности кодирующие белки), rRNA (рибосомальные РНК), tRNA (транспортные РНК), ncRNA (некодирующие РНК), tmRNA (транспортно-матричная РНК, участвующая в транс-трансляции) и misc_RNA (miscellaneous RNA, которая может выполнять функции ферментативного катализа и процессинга РНК [4]). Все виды РНК, кроме misc_RNA, и большинство белок кодирующих последовательностей располагаются на хромосоме. На плазмиде находятся 102 CDS и misc_RNA, что может говорить о повышение приспособленности бактерии за счет данной плазмиды. (См. Таблица 1)

3.2 Анализ аминокислотных последовательностей.

На рисунке 1 представлено распределение белков по их длинам. Наибольшее количество белков находятся в интервале 200-249 аминокислотных остатков (564 белка, около 12,46% от всех белков). После данного пика имеется тенденция на уменьшение количества белков при увеличении длины. Минимальная длина белка - 14 ам. ост. (лидирующий пептид trp-оперона), максимальная длина - 5559 ам.ост. (белок внутренней мембраны).

3.3 Анализ расстояний между последовательностями (CDS).

Были проанализированы белок-кодирующие последовательности на плюс-цепи самой большой хромосомы. На рисунке 2 представлено распределение расстояний между ними. Наибольшее количество межгенных участков имеет длину от 0 до 49 нуклеотидов. Большое количество расстояний между CDS меньше 0, это означает что их рамки считывания перекрываются.

Сопроводительные материалы:

Таблица Google Sheets:
https://docs.google.com/spreadsheets/d/1YRcZdItPBa26A5xY3MqNCP0mJUl1j2Dr G5Ysw3G66pg/edit?usp=sharing