Обзор генома Thermococcus profundus

ВВЕДЕНИЕ

Thermococcus profundus - гипертермофильный кокковидный архей диаметром 1-2 мкм. Архею T.profundus относят к классу Thermococci и семейству Thermococcaceae. Ниже представлено ее полное таксономическое положение [2]:

Superkingdom: Archaea
Kingdom: Methanobacteriati
Phylum: Methanobacteriota
Class: Thermococci
Order: Thermococcales
Family: Thermococcaceae
Genus: Thermococcus
Species: T.profundus
    

T.profundus была выделена из глубоководной гидротермальной системы (глубина 1395 м) в желобе Окинава [1]. Было обнаружено, что одна амилаза, выделенная из штамма T. profundus DT5432, функционирует при оптимальной температуре 80 °C. Ученые, которые ее выделили, предполагают, что она может найти применение в крахмало-паточной промышленности из-за своей термостойкости и отсутствия потребности в ионах металлов [3].

МЕТОДЫ

В ходе работы были использованы данные о последовательности генома, аминокислотные последовательности белков и таблица геномных особенностей археи Thermococcus profundus, загруженные из электронной базы данных NCBI (NCBI).

С помощью средств электронных таблиц (функции =СЧЁТЕСЛИМН, =СЧЁТЕСЛИ, =МАКС, =МИН) были построены гистограммы длин белков (Таблица S3), гистограмма процентного содержания гуанина и цитозина (Таблица S4), гистограмма процентного содержания аминокислот (Таблица S2) и таблица количества кодируемых последовательностей разных типов в геноме (S1). Команды Bash использовались для получения данных о количестве аминокислот в протеоме. Список команд:

grep -v '^>' *.faa | tr -d '\n' | fold -w1 | sort | uniq -c
    

РЕЗУЛЬТАТЫ

3.1 Длины белков

Длины белков Thermococcus profundus находятся в интервале от 40 до 4689 аминокислотных остатков (а. о.). Из гистограммы видно, что в геноме бактерии преобладают белки длины от 150 до 200 а. о.

Гистограмма длин белков

Рис. 1 Гистограмма длин белков археи Thermococcus profundus (Таблица S3)

В геноме T.profundus преобладают белки небольшой длины. Белки в этом диапазоне длины могут быть оптимально сконструированы для выполнения специфических функций, таких как ферментативные реакции, связывание с другими молекулами или участие в клеточных процессах.

3.2 Процентное содержание гуанина и цитозина по кодирующим последовательностям

Из гистограммы видно, что содержание гуанина и цитозина в среднем для большей части кодирующих последовательностей составляет 52,5-57%.

gc%

Рис. 2 Гистограмма %GC по CDS археи Thermococcus profundus(Таблица S4)

В общем можно заметить, что содержание GC в кодирующих последовательностях велико. Высокое содержание GC может свидетельствовать о более стабильной структуре ДНК, так как G и C образуют три водородные связи между собой, в отличие от двух водородных связей между аденином (A) и тимином (T). Это может быть полезно для бактерий, живущих в экстремальных условиях, таких как высокая температура или кислотность.

3.3 Количество кодируемых последовательностей разных типов в геноме

Таблица 1 отображает количество белков и генов различных типов РНК для каждого репликона археи T.profundus, геном которой представлен одной хромосомой и одной плазмидой

seq_type CDS tRNA rRNA ncRNA
chromosome 2092 46 4 2
plasmid 32 0 0 0

Табл. 1 Данные о генах в разных репликонах археи Thermococcus profundus (S1)

Таким образом, плазмида несет только белок-кодирующие гены, тогда как кольцевая ДНК T.profundus содержит в себе не только кодирующие последовательности белков, но и гены разных видов РНК. Содержание tRNA и rRNA указывает на активный синтез белков и рибосомную активность. Наличие ncRNA может свидетельствовать о наличии регуляторных механизмов.

3.4 Процент содержания аминокислот в протеоме

На рис.3 изображена диаграмма, показывающая процентное содержание всех аминокислот протеома T.profundus.

% Содержания аминокислот

Рис. 3 Гистограмма %аминокислот археи Thermococcus profundus (Таблица S2)

Таким образом, наиболее распространенные аминокислоты:

Наименее распространенные аминокислоты:

Заметим, что протеом T.profundus имеет довольно высокий процент содержания аминокислот E (8,6%), R (5,9%) и K (5,6%), что характерно для (гипер-)термофильных видов [4].

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

СПИСОК ЛИТЕРАТУРЫ