Вы находитесь на главной странице учебного сайта Яковлевой Марии.
Здесь будут выкладываться результаты практических работ по биоинформатике и не только :з
Яковлева Мария Владимировна
Факультет Биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова, Москва, Россия
Контакты: yakovleva.marusya@yandex.ru.
Bacteria
Pseudomonadota
Gammaproteobacteria
Enterobacterales
Enterobacteriaceae
Salmonella
Salmonella enterica
Salmonella enterica subsp. enterica
Salmonella enterica subsp. enterica serovar Typhimurium str. LT2
Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 является серотипом подвида Salmonella enterica. Серотипы данного подвида определяют на основе их соматических (расположенных в клеточной стенке) и жгутиковых антигенов. Данная бактерия палочковидная, аэробная, грамотрицательная и имеет жгутики. В подвид S. enterica subsp. enterica входит большое количество серотипов, способных инфицировать разных позвоночных. Спектр хозяев S. enterica subsp. enterica serovar Typhimurium str. LT2 очень широк: люди, крупный рогатый скот, свиньи, овцы, лошади, грызуны, курообразные [2]. В данном мини-обзоре представлено описание генома и протеома Salmonella enterica subsp. enterica serovar Typhimurium str. LT2.
Данные по геному и протеому Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 были взяты с сайта Национального Центра Биотехнологической информации (NCBI) [3]. Анализ данных и представление результатов в виде гистограмм и таблиц проводились с использованием электронных таблиц Google Sheets [1]. Для подсчета количества ячеек по определенному критерию была использована функция “COUNTIFS”.
Геном Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 представляет собой одну хромосому и одну плазмиду(pSLT).
# | seq_type | chromosome | CDS | rRNA tRNA ncRNA tmRNA | misc_RNA |
---|---|---|---|---|---|
1 | chromosome | - | 4452 | 22 / 85 / 9 / 1 | 0 |
2 | plasmid | pSLT | 102 | 0 / 0 / 0 / 0 | 1 |
Было выявлено 6 типов кодирующих последовательностей: CDS (coding sequences - последовательности кодирующие белки), rRNA (рибосомальные РНК), tRNA (транспортные РНК), ncRNA (некодирующие РНК), tmRNA (транспортно-матричная РНК, участвующая в транс-трансляции) и misc_RNA (miscellaneous RNA, которая может выполнять функции ферментативного катализа и процессинга РНК [4]). Все виды РНК, кроме misc_RNA, и большинство белок кодирующих последовательностей располагаются на хромосоме. На плазмиде находятся 102 CDS и misc_RNA, что может говорить о повышение приспособленности бактерии за счет данной плазмиды. (См. Таблица 1)
На рисунке 1 представлено распределение белков по их длинам. Наибольшее количество белков находятся в интервале 200-249 аминокислотных остатков (564 белка, около 12,46% от всех белков). После данного пика имеется тенденция на уменьшение количества белков при увеличении длины. Минимальная длина белка - 14 ам. ост. (лидирующий пептид trp-оперона), максимальная длина - 5559 ам.ост. (белок внутренней мембраны).
Были проанализированы белок-кодирующие последовательности на плюс-цепи самой большой хромосомы. На рисунке 2 представлено распределение расстояний между ними. Наибольшее количество межгенных участков имеет длину от 0 до 49 нуклеотидов. Большое количество расстояний между CDS меньше 0, это означает что их рамки считывания перекрываются.
Таблица Google Sheets:
https://docs.google.com/spreadsheets/d/1YRcZdItPBa26A5xY3MqNCP0mJUl1j2Dr G5Ysw3G66pg/edit?usp=sharing