Мини-обзор генома бактерии Streptococcus thermophilus

Автор: Сапаров Александр Студент 1 курса ФББ МГУ им. М. В. Ломоносова

Введение

Streptococcus thermophilus - это грамположительная, факультативная анаэробная бактерия, не способная к локомоции. Имеет сферические клетки диаметром 0.7-0.9 мкм., зачастую образующие цепочки из 10-20 особей. Оптимальная температура для роста 37 °C, а минимальная 10 °C. Streptococcus thermophilus - широко известная молочнокислая бактерия, которая активно применяется в промышленности. Например за 1998 год в США она наферментировала миллиард килограмм сыра и 621 миллион килограмм йогурта. Бактерии ферментируют лактозу, содержащуюся в молоке, образуя молочную кислоту. Этот процесс является основой производства молочнокислой продукции, но они способны ферментировать и другие углеводы [1], [2]. S. thermophilus достаточно плохо умеют расщеплять белки и в основном потребляют свободные аминокислоты, так что в случае их недостатка становятся зависимы от процессов гидролиза белков другими бактериями [3]. S. thermophilus считается непатогенным и даже полезным. Бактерия не является постоянным жителем кишечника человека, но при употреблении содержащих ее продуктов, оказывает положительное влияние на здоровье ЖКТ, например улучшает усвоение молока, путем выработки фермента лактазы [4].

Таксономия:

д. Bacteria | к. Terrabacteria | т. Bacillota | к. Bacilli | п. Lactobacillales | с. Streptococcaceae | р. Streptococcus | в. Streptococcus thermophilus

Методы

Результаты получены с помощью следующих методов: Метод электронных таблиц Google sheets (использовались методы: COUNTIF; VLOOKUP, IFERROR, SUM, SUMIF и др.) Собственные программы, написанные на языке Python: программы для подсчета количества нуклеотидов участков генома бактерии (1). Из NCBI были загружены следующие данные: нуклеотидная последовательность CDS кодирующих генов, нуклеотидная последовательность RNA кодирующих генов, нуклеотидная последовательность всего генома, таблица локальных особенностей генома. Ссылки на загруженные файлы представлены в сопроводительных материалах (2).

Результаты

1. Соотношение длин белков

На (+) цепи хромосомы бактерии были подсчитаны длины белков, кодируемых геномом бактерии. Гистограмма на Рис.1 иллюстрирует отношение длин белков к их количеству.

...

Таким образом можно заметить, что большинство белков имеют длину в 40-490 аминокислот, а белков длиной менее 40 и более 890 практически нет.

2. Удаленность кодирующих участков генома бактерии.

На (+) цепи хромосомы бактерии были подсчитаны длины промежутков между кодирующими участками генома и отношение длин к их количеству (Рис.2)

...

Эта картина очень похожа на гистограмму длин белков. Мы снова видим, что большинство участков лежат в одном среднем диапазоне (100-1400), а слишком коротких (0-100) и длинных (2300-4400) исчезающе мало.

3. Количество «старт-кодонов» кодирующих участков генома

Было подсчитано количество различных первых кодонов на всех CDS кодирующих участках генома, на псевдогенах и без учета псевдогенов (Табл.1)

...

Как видим, псевдогены относительно часто начинаются не со старт-кодонов. Учитывая, что в псевдогенах происходят мутации, которые никак не влияют на жизнеспособность организма, вполне естественно, что многие первые кодоны в ходе этих генах заменились на случайные триплеты. Практически все гены, кодирующие функциональные белки, как и ожидается, начинаются со старт-кодонов. Но, как можно заметить, 2 гена начинаются с кодона ATC, не являющегося старт-кодоном. Он отличается на один нуклеотид от ATG - основного старт-кодона, так что по всей видимости эти гены не жизненно необходимы для бактерии, и на них тоже могли возникнуть мутации.

4. Сравнение соотношения нуклеотидов во всем геноме бактерии и генах, кодирующих белки и РНК

Подсчитано количество нуклеотидов и их соотношение на всем геноме бактерии, РНК-кодирующих и CDS-кодирующих участках с обеих ( + и - ) цепочек хромосомы (Табл.2)

...

Можно заметить, что большую часть генома занимают CDS-кодирующие участки (на них приходится 85.25% кода), в то время как на РНК-кодирующие участки приходится лишь небольшая его часть (1.87%). На всем геноме нуклеотидных пар A-T несколько больше, чем C-G, такая же ситуации и на CDS-кодирующих участках - на них сохраняется примерно то же соотношение. На РНК участках напротив нуклеотидных пар примерно поровну.

Сопроводительные материалы

(1) Программы Python

(2) Данные о геноме Streptococcus thermophilus с сайта NCBI: cds_from_genomic (нуклеотидная последовательность CDS кодирующих генов); rna_from_genomic (нуклеотидная последовательность RNA кодирующих генов); genomic (нуклеотидная последовательность всего генома); feature_table (таблица локальных особенностей генома)

Благодарности

От всего сердца хочу поблагодарить преподавателя физкультуры, имя которого я не знаю, который без объяснения причин исключил меня из своей учебной группы, тем самым освободив для меня 1,5 часа в неделю на великие дела, а также Ивана Русинова, за его отдачу и помощь в исправлении пр.6.

Литература

1. R.K. Robinson. FERMENTED MILKS | Yoghurt, Role of Starter Cultures. Encyclopedia of Dairy Sciences. 2002. doi:10.1016/B0-12-227235-8/00172-3

2. Anna Grizon, Sebastien Theil, Cecile Callon, Pauline Gerber, Sandra Helinck, Eric Dugat-Bony, Pascal Bonnarme, Christophe Chassard. Genetic and technological diversity of Streptococcus thermophilus isolated from the Saint-Nectaire PDO cheese-producing area. 2023. doi: 10.3389/fmicb.2023.1245510

3. Jiancun Zhao, Yan Liang, Susu Zhang, Zhenshang Xu. Effect of sugar transporter on galactose utilization in Streptococcus thermophilus. 2023. doi: 10.3389/fmicb.2023.1267237

4. Anđela Martinović, Riccardo Cocuzzi, Stefania Arioli, Diego Mora. Streptococcus thermophilus: To Survive, or Not to Survive the Gastrointestinal Tract, That Is the Question! 2020. doi: 10.3390/nu12082175