В данной работе представлен обзор генома и протеома бактерии Streptomyces rimosus subsp. rimosus ATCC 10970 с помощью электронных таблиц (Google Sheets) и интернет-ресурсов (веб-сайт NCBI, алгоритм Blast).
Streptomyces rimosus subsp. rimosus ATCC 10970 - грамположительный аэробный актиномицет, штамм бактерии вида Streptomyces rimosus. Относится к роду Streptomyces, семейства Streptomycetaceae [1]. Для бактерий этого рода характерны такие черты, как большой размер генома, высокое содержание GC-пар, способность продуцировать большой спектр антибиотиков. Обнаруживаются преимущественно в почве и гниющей растительности [3]. В данной работе исследуются общие данные о структуре генома и протеома Streptomyces rimosus subsp. rimosus ATCC 10970.
Данные о геноме исследуемой бактерии взяты с сайта National Center for Biotechnological Information ( NCBI) [2] и обработаны в электронных таблицах Google Sheets, анализ псевдогенов проводился с помощью алгоритмов Blast.
Результат анализа длин белков, встречающихся в бактерии Streptomyces rimosus subsp. rimosus ATCC 10970 можно представить в виде гистограммы:
Как видно из Рисунка 1, наиболее распространенная длина белка - от 275 до 300 аминокислотных остатков. Количество белков длины от 50-75 до примерно 400-425 значительно выше остальных. В меньшей степени в геноме исследуемой бактерии встречаются белки длиной больше 1325 аминокислот. Белок, обладающей наибольшей длиной (9473 остатка) - поликетидсинтаза 1 типа, ферментный комплекс, осуществляющий биосинтез таких вторичных метаболитов, как антибиотики и токсины (2).
На Рисунке 2 приведено распределение процентного содержания пар гуанин-цитозин в кодирующих последовательностях бактерии. Минимальная доля GC-пар - 56-57%, наиболее часто встречающиеся значение - 72-73%, в некоторых cds процент доходит до 81. Эти данные согласуются с фактом высокого содержания гуанина и цитозина у всего рода Streptomyces, что может свидетельствовать о возможной способности бактерий этой группы обитать в условиях высокой температуры (1), [4].
seq_type | chromosome | CDS | ncRNA | rRNA | tmRNA | tRNA |
---|---|---|---|---|---|---|
chromosome | 8117 | 2 | 21 | 1 | 68 | |
plasmid | pSRP1 | 288 | 0 | 0 | 0 | 0 |
Геном Streptomyces rimosus subsp. rimosus ATCC 10970 состоит из одной хромосомы и одной плазмиды. Как видно из таблицы, всего в геноме бактерии представлены 5 типов кодирующих последовательностей:
1)CDS - белок кодирующие последовательности (coding sequences), нуклеотидная последовательность которых соответствует аминокислотной последовательности кодируемого белка.
2)ncRNA - некодирующие РНК, могут выполнять такие функции как регуляция экспрессии генов, модификация других нуклеиновых кислот, катализ и др.
3)rRNA - рибосомальные РНК.
4)tmRNA - транспортно-матричная РНК. участвует в высвобождении остановившихся на мРНК рибосом (например когда мРНК образует стабильную трехмерную структуру, препятствующую синтезу белка).
5)tRNA - транспортная РНК.
В геноме бактерии преобладают CDS, некодирующие и транспортно-матричные РНК имеют минимальное содержание в геноме, плазмида (pSRP1) кодирует только CDS [5].
Псевдогены - это нефункциональные нуклеотидные последовательности, появляющиеся в результате мутаций в функциональных генах, таких как появление стоп-кодона, сдвиг рамки считывания, инделей и др. С помощью инструментов выравнивания был проведен анализ сходства трех наиболее длинных псевдогенов с продуктами функциональных генов из баз данных NCBI, что позволило сделать предположение об белках, кодируемых ими до потери функции:
1)Белок, наиболее схожий с последовательность в 3065 нуклеотидов включает в себя домены аденилирования аминокислот, то есть возможно участвует в посттрансляционной модификации других белков, а именно в реакции присоединения молекулы АМФ к боковой цепи белка) (3).
2) Белок, схожий с псевдогеном длиной в 3003 нуклеотида относится к классу лигаз, а может проявлять как дигуанилатциклазную активность (катализ реакции ГТФ = цГМФ + пирофосфат), так и фосфодиэсеразную (гидролиз фосфодиэфирной связи) (4) .
3)Последний псевдоген возможно кодировал бы белок, содержащий домен связывания молибдоптерина - кофактора небелковой природы, характерного для таких ферментов как ксантинооксидазы, нитратредуктазы и других фрементов, в основном осуществляющих окислительно-восстановительные реакции (5).
Полученные данные кратко изложены в таблице 2.
Gene ID псевдогена | Длина псевдогена (нуклеотидов) | Последовательность белка | Описание белка | Результат выравнивания (номер иллюстрации) |
---|---|---|---|---|
66856922 | 3065 | WP_053819135.1 | Белок, содержащий домен аденилирования аминокислот | 1 |
6510284 | 3003 | WP_033034337.1 | Бифункциональная дигуанилатциклаза/фосфодиэстераза | 2 |
66854872 | 2762 | WP_050506217.1 | Белок, содержащий домен связывания кофактора молибдоптерина | 3 |
С помощью интернет ресурсов и интернет-баз данных были получены результаты о геноме бактерии Streptomyces rimosus subsp. rimosus ATCC 10970.
[1] Классификация Streptomyces rimosus subsp. rimosus ATCC 10970
[2] Геном Streptomyces rimosus subsp. rimosus ATCC 10970
[3] Общая характеристика рода Streptomyces
[4] Таблица CDS Streptomyces rimosus subsp. rimosus ATCC 10970
[5] Таблица локальных особенностей Streptomyces rimosus subsp. rimosus ATCC 10970