Thermococcus profundus - гипертермофильный кокковидный архей диаметром 1-2 мкм. Архею T.profundus относят к классу Thermococci и семейству Thermococcaceae. Ниже представлено ее полное таксономическое положение [2]:
Superkingdom: Archaea Kingdom: Methanobacteriati Phylum: Methanobacteriota Class: Thermococci Order: Thermococcales Family: Thermococcaceae Genus: Thermococcus Species: T.profundus
T.profundus была выделена из глубоководной гидротермальной системы (глубина 1395 м) в желобе Окинава [1]. Было обнаружено, что одна амилаза, выделенная из штамма T. profundus DT5432, функционирует при оптимальной температуре 80 °C. Ученые, которые ее выделили, предполагают, что она может найти применение в крахмало-паточной промышленности из-за своей термостойкости и отсутствия потребности в ионах металлов [3].
В ходе работы были использованы данные о последовательности генома, аминокислотные последовательности белков и таблица геномных особенностей археи Thermococcus profundus, загруженные из электронной базы данных NCBI (NCBI).
С помощью средств электронных таблиц (функции =СЧЁТЕСЛИМН, =СЧЁТЕСЛИ, =МАКС, =МИН) были построены гистограммы длин белков (Таблица S3), гистограмма процентного содержания гуанина и цитозина (Таблица S4), гистограмма процентного содержания аминокислот (Таблица S2) и таблица количества кодируемых последовательностей разных типов в геноме (S1). Команды Bash использовались для получения данных о количестве аминокислот в протеоме. Список команд:
grep -v '^>' *.faa | tr -d '\n' | fold -w1 | sort | uniq -c
Длины белков Thermococcus profundus находятся в интервале от 40 до 4689 аминокислотных остатков (а. о.). Из гистограммы видно, что в геноме бактерии преобладают белки длины от 150 до 200 а. о.
Рис. 1 Гистограмма длин белков археи Thermococcus profundus (Таблица S3)
В геноме T.profundus преобладают белки небольшой длины. Белки в этом диапазоне длины могут быть оптимально сконструированы для выполнения специфических функций, таких как ферментативные реакции, связывание с другими молекулами или участие в клеточных процессах.
Из гистограммы видно, что содержание гуанина и цитозина в среднем для большей части кодирующих последовательностей составляет 52,5-57%.
Рис. 2 Гистограмма %GC по CDS археи Thermococcus profundus(Таблица S4)
В общем можно заметить, что содержание GC в кодирующих последовательностях велико. Высокое содержание GC может свидетельствовать о более стабильной структуре ДНК, так как G и C образуют три водородные связи между собой, в отличие от двух водородных связей между аденином (A) и тимином (T). Это может быть полезно для бактерий, живущих в экстремальных условиях, таких как высокая температура или кислотность.
Таблица 1 отображает количество белков и генов различных типов РНК для каждого репликона археи T.profundus, геном которой представлен одной хромосомой и одной плазмидой
seq_type | CDS | tRNA | rRNA | ncRNA |
---|---|---|---|---|
chromosome | 2092 | 46 | 4 | 2 |
plasmid | 32 | 0 | 0 | 0 |
Табл. 1 Данные о генах в разных репликонах археи Thermococcus profundus (S1)
Таким образом, плазмида несет только белок-кодирующие гены, тогда как кольцевая ДНК T.profundus содержит в себе не только кодирующие последовательности белков, но и гены разных видов РНК. Содержание tRNA и rRNA указывает на активный синтез белков и рибосомную активность. Наличие ncRNA может свидетельствовать о наличии регуляторных механизмов.
На рис.3 изображена диаграмма, показывающая процентное содержание всех аминокислот протеома T.profundus.
Рис. 3 Гистограмма %аминокислот археи Thermococcus profundus (Таблица S2)
Таким образом, наиболее распространенные аминокислоты:
Наименее распространенные аминокислоты:
Заметим, что протеом T.profundus имеет довольно высокий процент содержания аминокислот E (8,6%), R (5,9%) и K (5,6%), что характерно для (гипер-)термофильных видов [4].