Мини-обзор генома бактерии Synechococcus elongatus PCC 7942 = FACHB-805

Чикулаева Ольга Романовна

Факультет биоинженерии и биоинформатики Московского государственного университета имени М. В. Ломоносова

АННОТАЦИЯ

Данный мини-обзор посвящен анализу некоторых характеристик генома цианобактерии Synechococcus elongatus PCC 7942 = FACHB-805. На основе геномной сборки RefSeq GCF_000012525.1 проанализированы такие характеристики, как распределение длин кодируемых белков, число генов хромосомы и плазмиды, количество наиболее распространенных белков.

ВВЕДЕНИЕ

Synechococcus elongatus PCC 7942 = FACHB-805 — это штамм палочковидной цианобактерии Synechococcus elongatus, является одним из ключевых модельных организмов в современной биологии [1]. Это облигатный фотоавтотроф с геномом размером примерно 2,7 Мб [2]. Используется в синтетической биологии и биотехнологии, например, для очистки сточных вод [3], производства ценных химических соединений (в частности, омега-3 жирных кислот [4]), изучении циркадных ритмов бактерий [5], а также в медицинских исследованиях [6].

Известны геномы трех штаммов, использовался штамм PCC 7942 = FACHB-805 в геномной сборке NCBI RefSeq GCF_000012525.1, у которого количество репликонов 2 (кольцевая хромосома и плазмида) [7].

Систематическое положение Synechococcus elongatus PCC 7942 = FACHB-805 [8]:

Домен: Bacteria

Царство: Bacillati

Филум: Cyanobacteriota

Класс: Cyanophyceae

Порядок: Synechococcales

Семейство: Synechococcaceae

Род: Synechococcus

Вид: Synechococcus elongatus

Штамм: Synechococcus elongatus PCC 7942 = FACHB-805

МАТЕРИАЛЫ И МЕТОДЫ

Данные по геному и протеому исследуемой бактерии были взяты из базы Национального Центра Биотехнологической информации (NCBI), использовалась геномная сборка NCBI RefSeq GCF_000012525.1 [7]. Для обработки данных, их анализа и визуализации результатов (построение гистограммы) использовались электронные таблицы Google Sheets.

Для нахождения длины белков и построения гистограммы, отображающей их распределение, использовалась таблица кодирующих последовательностей бактерии (CDS from genome of Synechococcus elongatus PCC 7942 = FACHB-805; см. сопроводительные материалы, таблица S1). Результаты представлены в таблице с длинами белков (см. сопроводительные материалы, таблица S2, лист prot-lengths) и таблице с данными для гистограммы длин белков (см. сопроводительные материалы, таблица S3, лист prot_lengths_hist).

Для подсчета числа генов белков и разных типов РНК, а также количества самых распространенных белков использовалась таблица функциональных особенностей генома бактерии (Genomic features of Synechococcus elongatus PCC 7942 = FACHB-805; см. сопроводительные материалы, таблица S4). Результаты находятся в таблице с подсчетом генов разных типов (см. сопроводительные материалы, таблица S5, лист per_replicones) и в таблице с подсчетом количества самых распространенных белков соответственно (см. сопроводительные материалы, таблица S6, лист proteins).

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ

Длина белков, закодированных в геноме бактерии Synechococcus elongatus PCC 7942 = FACHB-805

Распределение длин белков (в аминокислотах), закодированных в геноме бактерии Synechococcus elongatus PCC 7942 = FACHB-805, представлено на гистограмме (рис. 1).

Гистограмма длин белков
Рис. 1. Гистограмма длин белков бактерии Synechococcus elongatus PCC 7942 = FACHB-805.

Большая часть белков бактерии имеет длину от 50 до 550 аминокислот.

Минимальная длина белка – 24 аминокислоты, максимальная – 1966 аминокислот. Среднее значение длины – 298 аминокислот, что немного больше среднего значения длины белков бактерий (267 аминокислот) [9]. Медиана - 251 аминокислота.

Число генов белков и генов разных типов РНК для репликонов бактерии Synechococcus elongatus PCC 7942 = FACHB-805

В таблице 1 представлено распределение числа генов, кодирующих белки и различные типы РНК, для двух репликонов – хромосомы и одной из плазмид – бактерии Synechococcus elongatus PCC 7942 = FACHB-805.

Таблица 1. Число генов белков и разных РНК на репликонах бактерии Synechococcus elongatus PCC 7942 = FACHB-805

Хромосома Плазмида
Число генов (общее) 2720 55
Число генов белков (кодирующих последовательностей (CDS)) 2656 55
Число кодирующих последовательностей (CDS), не кодирующих белок (псевдогенов) 9 0
Число генов рРНК 6 0
Число генов нкРНК 3 0
Число генов тмРНК 1 0
Число генов тРНК 45 0

В хромосоме намного больше генов, чем в плазмиде. К тому же, все гены плазмиды представляют собой белок-кодирующие последовательности (CDS): в отличии от хромосомы, нет псевдогенов и генов РНК, что подтверждает то, что она имеет ограниченную роль в геноме бактерии и несет какие-либо специализированные адаптивные функции (например, адаптации к стрессу), а основную генетическую роль выполняет хромосома.

В хромосоме наибольшее число генов – белок-кодирующие последовательности. Число последовательностей, не кодирующих белок или РНК (псевдогенов) – 9. Это небольшое число, что характерно для бактерий, так как они (псевдогены) быстро удаляются из их генома [10]. В хромосоме находятся гены рибосомальной (рРНК), транспортно-матричной (тмРНК), транспортной (тРНК) и некодирующих РНК (нкРНК).

Количество самых распространенных белков в геноме бактерии Synechococcus elongatus PCC 7942 = FACHB-805

Всего в геноме бактерии закодировано 1750 белков с уникальными названиями; названия 10 известных белков (для которых установлена их функция), которых большего всего, их количество и доля от общего количества белков (2711), а также количество и доля гипотетических белков, приведены в таблице 2.

Таблица 2. Название, количество и доля самых распространенных белков бактерии Synechococcus elongatus PCC 7942 = FACHB-805

Название белка Количество Доля от общего количества белков, %
hypothetical protein 428 15,79
ABC transporter ATP-binding protein 21 0,77
class I SAM-dependent methyltransferase 18 0,66
tetratricopeptide repeat protein 15 0,55
ABC transporter permease 14 0,52
alpha/beta fold hydrolase 13 0,48
GNAT family N-acetyltransferase 12 0,44
helix-turn-helix domain-containing protein 12 0,44
glycosyltransferase 11 0,41
alpha/beta hydrolase 10 0,37
NAD(P)/FAD-dependent oxidoreductase 10 0,37

15,78% от общего числа белков составляют гипотетические белки (hypothetical protein). Самый распространенный белок с известной функцией – АТФ-связывающий транспортный белок семейства ABC (ABC transporter ATP-binding protein), доля которого составляет 0,77%. У бактерий эти транспортеры играют роль в поглощении питательных веществ [11].

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

S1. Таблица кодирующих последовательностей бактерии (CDS from genome of Synechococcus elongatus PCC 7942 = FACHB-805): ссылка

S2. Таблица с длинами белков (лист prot-lengths): ссылка

S3. Таблица с данными для гистограммы длин белков (лист prot_lengths_hist): ссылка

S4. Таблица особенностей генома бактерии (Genomic features of Synechococcus elongatus PCC 7942 = FACHB-805): ссылка

S5. Таблица с подсчетом генов разных типов (лист per_replicones): ссылка

S6. Таблица с подсчетом количества самых распространенных белков (лист proteins): ссылка

СПИСОК ЛИТЕРАТУРЫ

1. Holtman C. K. et al. High-throughput functional analysis of the Synechococcus elongatus PCC 7942 genome //DNA research. – 2005. – Т. 12. – No. 2. – С. 103-115.

2. Kaneko T. et al. Physical and gene maps of the unicellular cyanobacterium Synechococcus sp. strain PCC6301 genome //Plant molecular biology. – 1996. – Т. 31. – No. 1. – С. 193-201.

3. Samiotis G., Stamatakis K., Amanatidou E. Assessment of Synechococcus elongatus PCC 7942 as an option for sustainable wastewater treatment //Water Science and Technology. – 2021. – Т. 84. – No. 6. – С. 1438-1451.

4. Santos-Merino M. et al. Synechococcus elongatus PCC 7942 as a platform for bioproduction of omega-3 fatty acids //Life. – 2022. – Т. 12. – No. 6. – С. 810.

5. Nishiwaki T. et al. Role of KaiC phosphorylation in the circadian clock system of Synechococcus elongatus PCC 7942 //Proceedings of the National Academy of Sciences. – 2004. – Т. 101. – No. 38. – С. 13927-13932.

6. Yin H. et al. Synechococcus elongatus PCC7942 secretes extracellular vesicles to accelerate cutaneous wound healing by promoting angiogenesis //Theranostics. – 2019. – Т. 9. – No. 9. – С. 2678.

7. Synechococcus elongatus PCC 7942 = FACHB-805 genome assembly ASM1252v1. – URL: https://www.ncbi.nlm.nih.gov/datasets/genome/GCF_000012525.1/

8. NCBI Taxonomy: Synechococcus elongatus PCC 7942 = FACHB-805. – URL: https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id=1140

9. Brocchieri L., Karlin S. Protein length in eukaryotic and prokaryotic proteomes //Nucleic acids research. – 2005. – Т. 33. – No. 10. – С. 3390-3400.

10. Kuo C. H., Ochman H. The extinction dynamics of bacterial pseudogenes //PLoS genetics. – 2010. – Т. 6. – No. 8. – С. e1001050.

11. Davidson A. L., Chen J. ATP-binding cassette transporters in bacteria //Annual review of biochemistry. – 2004. – Т. 73. – No. 1. – С. 241-268.