🌸Назад

Мини-обзор бактерии Chromobacterium phragmitis

Чумакова Ксения Романовна
Московский государственный университет им. Ломоносова
e-mail: ksushka707@mail.ru

Аннотация

В работе представлено изучение бактерии Chromobacterium phragmitis, анализ длины белков, содержания GC% и старт-кодонов. Средняя длина белков составляет 100–300 аминокислот, а GC% варьируется от 60 до 70%. При этом около 90% кодирующих последовательностей (CDS) начинаются со старт-кодона AUG. Большая часть названий псевдогенов соответствует семейству IS5 family transposase и transposase. Полученные данные подтверждают известные закономерности в характеристиках прокариот и способствуют пониманию эволюционной связи данного вида с другими бактериями.

Введение

Chromobacterium phragmitis – вид грамотрицательных, подвижных, фиолетовых бактерий. Они были выделены из болот вдоль приливных участков рек Потомак и Джеймс в штатах Мэриленд и Вирджиния (США) 8 августа 2014 года [1].

Таксономическая принадлежность бактерии:

Цель работы: знакомство с видом Chromobacterium phragmitis, исследование длин белков, GC%, старт-кодонов, псевдогенов данной бактерии, сравнение полученных данных с данными других исследователей.

Материалы и методы

  1. Для подсчета длин белков C. phragmitis была использована таблица о кодирующих участках ДНК [11], преобразованная в формат Google Table. По данным длины ДНК были найдены длины белков. После этого были созданы карманы по диапазонам значений и количеству длин белков в этих диапазонах, после чего была построена гистограмма.
  2. Для подсчета содержания GC C. phragmitis также была использована таблица о кодирующих участках ДНК [11], преобразованная в формат Google Table. В третьем столбце таблицы содержатся значения GC%. После этого были созданы карманы по диапазонам значений GC состава, после чего была построена гистограмма.
  3. Для подсчета метионина в старт-кодонах был использован состав всех белок-кодирующих участков [11] и язык программирования Python.
  4. Для анализа локальных особенностей генома была использована таблица локальных особенностей генома C. phragmitis [11].
  5. Для нахождения информации о таксономическом положении бактерии были использованы сайты NCBI, PubMed и другие.

Результаты и обсуждение

1. Длины белков

Ученые выяснили, что размеры белков влияют на их биохимическую структуру и биологические функции. Анализ статистического распределения длины белков в разных таксонах может осветить вопросы, связанные с эволюцией всех клеточных белков, поэтому может быть полезно анализировать длины белков и их функции. Достоверно известно, что средняя длина белков у бактерий составляет около 320 аминокислотных остатков[3]. На гистограмме (рисунок 1) Chromobacterium phragmitis видно, что средняя длина белков данного вида 100-300 аминокислотных остатков, что соответствует известным данным о длине белка у бактерий.

table

Рисунок 1

2. GC состав Chromobacterium phragmitis

В двойной спирали ДНК гуанин (G) всегда соответствует цитозину (C), а аденин (A) связан с тимином (T). Поэтому в геномах любых клеточных организмов количество G равно количеству C, и количество A соответствует количеству T. Процентное содержание GC, то есть сумма G и C, является важным показателем геномного состава нуклеотидов, пары G и C как правило более стабильны, поэтому используют именно их. Это значение может значительно варьироваться, находясь в диапазоне от 35% до 75%[4-7]. На гистограмме(рисунок 2) видно, что среднее значение процентного содержания GC находится в диапазоне 60-70%, что соответствует норме.

table

Рисунок 2

3. Старт-кодоны Chromobacterium phragmitis

Известно, что старт-кодон — первый триплет мРНК, с которого начинается трансляция белка в рибосоме. Или начало информационного промежутка соответствующей цепи ДНК. У всех организмов основным старт-кодоном является AUG(ATG для ДНК). Для прокариот характерен AUG в 80-90% случаях[8-10]. Именно поэтому я решила посмотреть характерно ли это для Chromobacterium phragmitis. Воспользовавшись данными о CDS[11] я написала программу, с помощью которой можно узнать интересующую меня информацию. Всего CDS(цепей ДНК) - 4507, из них 4083 начинаются с AUG, что составляет ≈ 90%. Можно также исследовать какие другие триплеты являются старт-кодонами, соответствуют ли они уже известным(GUG и UUG).

4. Названия псевдогенов у Chromobacterium phragmitis

Псевдогены обычно рассматриваются как неактивные копии генов, которые потеряли способность служить матрицами ДНК для производства функциональных продуктов[12]. Изучение псевдогенов, их активности, локализации, сравнение с соответствующими активными генами может быть хорошей почвой для дальнейших исследований. В своей работе я захотела изучить названия псевдогенов C. phragmitis. В таблице локальных особенностей бактерии содержится вся нужная для этого информация о псевдогенах. Для каждого из псевдогенов существует соответствующий ему without_protein, именно по ним и найдены названия семейств псевдогенов. Результаты можно увидеть в таблице 1.Имена которым соответсвуют более одного псевдогена это IS5 family transposase и transposase. Инсерционные последовательности (IS) — это мобильные повторяющиеся фрагменты ДНК, которые способны интегрироваться в различные участки генома хозяина. Это свойство вносит разнообразие в структуру генома и играет значительную роль в регуляции генов у прокариотов. В частности, было установлено, что IS5 может оказывать влияние на экспрессию близко расположенных генов[13]. Транспозаза – это фермент, который катализирует перемещение МЭ или транспозицию. Мобильные элементы (МЭ) – это участки ДНК, способные изменять свое положение в геноме, копироваться и включаться в специфические сайты[14].

Таблица 1

Название псевдогена Их количество
23S rRNA pseudouridine(1911/1915/1917) synthase RluD 1
ATP-binding protein 1
dephospho-CoA kinase 1
dihydrolipoyl dehydrogenase 1
DMT family transporter 1
DUF3579 domain-containing protein 1
GNA T family N-acetyltransferase 1
IS21-like element helper ATPase IstB 1
IS3 family transposase 1
IS5 family transposase 4
transposase 3
tyrosine-type recombinase/integrase 1

Список литературы

  1. Blackburn MB, Farrar RR Jr, Sparks ME, Kuhar D, Mowery JD, Mitchell A, Gundersen-Rindal DE. Chromobacterium phragmitis sp. nov., isolated from estuarine marshes. Int J Syst Evol Microbiol. 2019 Sep;69(9):2681-2686. doi: 10.1099/ijsem.0.003508. PMID: 31199223.
  2. Таксономическую принадлежность бактерии можно найти на сайте NCBI.
  3. Tissen A, Pérez-Rodríguez P, Delaye-Arredondo LJ. Mathematical modeling and comparison of protein size distribution in different plant, animal, fungal and microbial species reveals a negative correlation between protein size and protein number, thus providing insight into the evolution of proteomes. BMC Res Notes 5, 85 (2012).
  4. Basak S, Mukhopadhyay P, Gupta SK, Ghosh TC. Genomic adaptation of prokaryotic organisms at high temperature. Bioinformation. 2010;4(8):352–69.
  5. Nguyen DT, Wu B, Xiao S, Hao W. Evolution of a record-setting AT-rich genome: indel mutation, recombination, and substitution bias. Genome Biol Evol. 2020;12(12):2344–54.
  6. Mahajan S, Agashe D. Evolutionary jumps in bacterial GC content. bioRxiv. 2021; 2021.02.16.431469.
  7. Hu EZ, Lan XR, Liu ZL et al. A positive correlation between GC content and growth temperature in prokaryotes. BMC Genomics 23, 110 (2022).
  8. Peabody DS. Translation initiation at non-AUG triplets in mammalian cells. J Biol Chem. 1989 Mar 25;264(9):5031-5. PMID: 2538469.
  9. Lobanov AV, Turanov AA, Hatfield DL, Gladyshev VN. Dual functions of codons in the genetic code. Crit Rev Biochem Mol Biol. 2010 Aug;45(4):257-65. doi: 10.3109/10409231003786094. PMID: 20446809; PMCID: PMC3311535.
  10. Blattner FR, Plunkett G 3rd, Bloch CA, Perna NT, Burland V, Riley M, Collado-Vides J, Glasner JD, Rode CK, Mayhew GF, Gregor J, Davis NW, Kirkpatrick HA, Goeden MA, Rose DJ, Mau B, Shao Y. The complete genome sequence of Escherichia coli K-12. Science. 1997 Sep 5;277(5331):1453-62. doi: 10.1126/science.277.5331.1453. PMID: 9278503.
  11. Ссылка, по которой можно найти и скачать файлы всех белок-кодирующих участков (CDS from genomic), таблицу локальных особенностей (feature table) Chromobacterium phragmitis.
  12. Vanin EF. Processed pseudogenes: Characteristics and evolution. Annu Rev Genet. 1985;19:253–272. doi: 10.1146/annurev.ge.19.120185.001345.
  13. Tempel S, Bedo J, Talla E. From a large-scale genomic analysis of insertion sequences to insights into their regulatory roles in prokaryotes. BMC Genomics. 2022 Jun 20;23(1):451.
  14. Статья о транспозазах. Декабрь 2006 года, Дэвид Гудселл.