Мини-обзор генома и протеома бактерии Streptomyces rimosus subsp. rimosus ATCC 10970

Федоров Станислав

Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М. В. Ломоносова, Москва

Резюме

В данной работе представлен обзор генома и протеома бактерии Streptomyces rimosus subsp. rimosus ATCC 10970 с помощью электронных таблиц (Google Sheets) и интернет-ресурсов (веб-сайт NCBI, алгоритм Blast).

Введение

Streptomyces rimosus subsp. rimosus ATCC 10970 - грамположительный аэробный актиномицет, штамм бактерии вида Streptomyces rimosus. Относится к роду Streptomyces, семейства Streptomycetaceae [1]. Для бактерий этого рода характерны такие черты, как большой размер генома, высокое содержание GC-пар, способность продуцировать большой спектр антибиотиков. Обнаруживаются преимущественно в почве и гниющей растительности [3]. В данной работе исследуются общие данные о структуре генома и протеома Streptomyces rimosus subsp. rimosus ATCC 10970.

2 Методы и материалы

Данные о геноме исследуемой бактерии взяты с сайта National Center for Biotechnological Information ( NCBI) [2] и обработаны в электронных таблицах Google Sheets, анализ псевдогенов проводился с помощью алгоритмов Blast.

3 Результаты

3.1 Длины белков

Результат анализа длин белков, встречающихся в бактерии Streptomyces rimosus subsp. rimosus ATCC 10970 можно представить в виде гистограммы:

Hist
Рисунок 1. Гистограмма длинн белков в аминокислотных остатках.

Как видно из Рисунка 1, наиболее распространенная длина белка - от 275 до 300 аминокислотных остатков. Количество белков длины от 50-75 до примерно 400-425 значительно выше остальных. В меньшей степени в геноме исследуемой бактерии встречаются белки длиной больше 1325 аминокислот. Белок, обладающей наибольшей длиной (9473 остатка) - поликетидсинтаза 1 типа, ферментный комплекс, осуществляющий биосинтез таких вторичных метаболитов, как антибиотики и токсины (2).

3.2 Содержание GC-пар

Hist
Рисунок 2. Гистограмма процентного содержания GC-пар в генах.

На Рисунке 2 приведено распределение процентного содержания пар гуанин-цитозин в кодирующих последовательностях бактерии. Минимальная доля GC-пар - 56-57%, наиболее часто встречающиеся значение - 72-73%, в некоторых cds процент доходит до 81. Эти данные согласуются с фактом высокого содержания гуанина и цитозина у всего рода Streptomyces, что может свидетельствовать о возможной способности бактерий этой группы обитать в условиях высокой температуры (1), [4].

3.3 Количество кодируемых последовательностей разных типов в геноме

Таблица 1. Число генов белков и генов разных типов РНК для каждого репликона
seq_type chromosome CDS ncRNA rRNA tmRNA tRNA
chromosome 8117 2 21 1 68
plasmid pSRP1 288 0 0 0 0

Геном Streptomyces rimosus subsp. rimosus ATCC 10970 состоит из одной хромосомы и одной плазмиды. Как видно из таблицы, всего в геноме бактерии представлены 5 типов кодирующих последовательностей:

1)CDS - белок кодирующие последовательности (coding sequences), нуклеотидная последовательность которых соответствует аминокислотной последовательности кодируемого белка.

2)ncRNA - некодирующие РНК, могут выполнять такие функции как регуляция экспрессии генов, модификация других нуклеиновых кислот, катализ и др.

3)rRNA - рибосомальные РНК.

4)tmRNA - транспортно-матричная РНК. участвует в высвобождении остановившихся на мРНК рибосом (например когда мРНК образует стабильную трехмерную структуру, препятствующую синтезу белка).

5)tRNA - транспортная РНК.

В геноме бактерии преобладают CDS, некодирующие и транспортно-матричные РНК имеют минимальное содержание в геноме, плазмида (pSRP1) кодирует только CDS [5].

3.4 Анализ возможных функций псевдогенов

Псевдогены - это нефункциональные нуклеотидные последовательности, появляющиеся в результате мутаций в функциональных генах, таких как появление стоп-кодона, сдвиг рамки считывания, инделей и др. С помощью инструментов выравнивания был проведен анализ сходства трех наиболее длинных псевдогенов с продуктами функциональных генов из баз данных NCBI, что позволило сделать предположение об белках, кодируемых ими до потери функции:

1)Белок, наиболее схожий с последовательность в 3065 нуклеотидов включает в себя домены аденилирования аминокислот, то есть возможно участвует в посттрансляционной модификации других белков, а именно в реакции присоединения молекулы АМФ к боковой цепи белка) (3).

2) Белок, схожий с псевдогеном длиной в 3003 нуклеотида относится к классу лигаз, а может проявлять как дигуанилатциклазную активность (катализ реакции ГТФ = цГМФ + пирофосфат), так и фосфодиэсеразную (гидролиз фосфодиэфирной связи) (4) .

3)Последний псевдоген возможно кодировал бы белок, содержащий домен связывания молибдоптерина - кофактора небелковой природы, характерного для таких ферментов как ксантинооксидазы, нитратредуктазы и других фрементов, в основном осуществляющих окислительно-восстановительные реакции (5).

Полученные данные кратко изложены в таблице 2.

Таблица 1. Число генов белков и генов разных типов РНК для каждого репликона
Gene ID псевдогена Длина псевдогена (нуклеотидов) Последовательность белка Описание белка Результат выравнивания (номер иллюстрации)
66856922 3065 WP_053819135.1 Белок, содержащий домен аденилирования аминокислот 1
6510284 3003 WP_033034337.1 Бифункциональная дигуанилатциклаза/фосфодиэстераза 2
66854872 2762 WP_050506217.1 Белок, содержащий домен связывания кофактора молибдоптерина 3

Заключение

С помощью интернет ресурсов и интернет-баз данных были получены результаты о геноме бактерии Streptomyces rimosus subsp. rimosus ATCC 10970.

4 Сопроводительные материалы

[1] Классификация Streptomyces rimosus subsp. rimosus ATCC 10970

[2] Геном Streptomyces rimosus subsp. rimosus ATCC 10970

[3] Общая характеристика рода Streptomyces

[4] Таблица CDS Streptomyces rimosus subsp. rimosus ATCC 10970

[5] Таблица локальных особенностей Streptomyces rimosus subsp. rimosus ATCC 10970

Illust
Иллюстрация 1

Illust
Иллюстрация 2

Illust
Иллюстрация 3