Мини-обзор генома и протеома бактерии Pseudoalteromonas arctica A 37-1-2

Дмитрий Романьков
Факультет Биоинженерии и Биоинформатики, Московский государственный университет имени М.В.Ломоносова

ВВЕДЕНИЕ

Гамма-протеобактерия Pseudoalteromonas arctica является строго аэробной гетеротрофной морской криофильной бактерией, впервые выделена из образцов арктической морской воды, взятых в Шпицбергене (Норвегия). Клетки прямые, палочковидные, грамотрицательные, шириной 0,15-0,2 мкм и длиной 0,4-0,7 мкм. Не образуют спор, встречаются поодиночке, оптимальная температура для роста - 10-15 °C [1]. Бактерии рода Pseudoalteromonas представляют интерес для исследователей, потому что многие виды синтезируют широкий спектр различных антимикробных метаболитов (алкалоиды, поликетиды, пептиды) и играют важную экологическую роль, являясь частью постоянной микробиоты некоторых макроорганизмов (Cnidaria, Porifera, других?)[2], некоторые виды обладают способностью к биодеградации нефтяных углеводородов [3].

В данной работе для вида Pseudoalteromonas arctica A 37-1-2 проведен анализ стандартных данных каждой ДНК, приведены статистические данные о белках протеома и генах РНК.

МАТЕРИАЛЫ И МЕТОДЫ

Данные о об особенностях генома взяты с сайта NCBI (Национальный центр биотехнологической информации США) [4]. Анализ генома и протеома проводился с помощью электронных таблиц Google Sheets и программ, написанных на языке Python, данные о бактерии были загружены в таблицу особенностей генома с названием Genome Features.

РЕЗУЛЬТАТЫ

1. Анализ генома

1.1. GC состав

Геном бактерии состоит из двух кольцевых хромосом и кольцевой плазмиды (таблица 1). Данные о длине каждой ДНК и GC составе взяты с ресурса [4]. Предположительно, у криофильных бактерий, адаптированных к жизни в низких температурах, GC состав будет ниже средних значений (менее 50 процентов), что соответствует полученным результатам (колонии Pseudoalteromonas arctica растут уже при температуре 4°C, общий GC-процент составляет 39).

Таблица 1. Стандартные данные о геноме
ДНК Длина в п.н. GC состав
Chromosome I 3840834 39.5%
Chromosome I 783876 38.5%
Plasmid (unnamed) 97261 38.5%

1.2 Анализ частот встречаемости старт кодонов

С помощью программы на языке Python (см. Сопроводительные материалы, Программа 2) получил количество встретившихся старт-кодонов (таблица 2). Чаще всего используется кодон ATG, реже, но тоже часто используются кодоны GTG и TTG, остальные кодоны используются гораздо реже. Вероятно, это происходит потому, что GTG и TTG очень похожи на канонический старт кодон ATG (отличается только один нуклеотид) и мутация слабо повлияла на экспрессию гена или была компенсирована мутациями в последовательности Шайна — Дальгарно [5]. Старт кодоны, встретившиеся только один раз, за редким исключением, находятся на псевдогенах

Таблица 2. Количество встретившихся стоп кодонов
ATG GTG TTG остальные кодоны
Количество встретившихся старт-кодонов 3626 297 160 AAA 1, AAC 1, AAT 2, ACA 3, ACC 1, AGT 1, ATA 9, ATC 5, ATT 10, CAA 1, CCT 1, CGT 1, CTA 1, CTG 2, GAC 1, GAG 1, GAT 1, GCC 1, GGA 1, GGT 1, GTC 1, TGG 1, TTA 2, TTT 1

1.3 Анализ частот встречаемости стоп кодонов

С помощью программы, написанной на языке Python (см.Сопроводительные материалы, Программа 1) получил количество встретившихся стоп-кодонов (Таблица 2). Каждый из трех стоп кодонов встретился множество раз, значит они точно не выполняют кодирующую функцию. Преобладающим оказался кодон TAA, его встречаемость примерно втрое превышает TGA и TAG вместе взятых.

Таблица 3. Количество встретившихся стоп кодонов
TGA TAA TAG
Количество встретившихся стоп-кодонов 459 2979 673

2. Анализ протеома

2.1. Распределение длин белков

С помощью электронных таблиц было получено распределение длин белков (Гистограмма 1).

Гистограмма 1.Распределение длин белков

Также были определены среднее значение, медиана, стандартное отклонение (среднее квадратичное отклонений данных от среднего значения), минимальное и максимальное значения длин (таблица 4). Интересным наблюдением оказалось то, что самый крупный белок имеет длину 7102 аминокислот и содержит иммуноглобулин-подобный домен.

Таблица 4. Описательная статистика длин белков
Среднее значение 332,
Стандартное отклонение 250,8
Медиана 279
Минимальное значение 22
Максимальное значение 7102

2.2. Анализ количества белков

С помощью таблицы особенностей генома (list CDS) был проведен анализ количества генов белков, закодированных на прямой и комплементарной цепочке (для каждой ДНК), результаты представлены в таблице 5. Всего на прямой цепи находится 2122 генов белков, на комплементарной цепи - 1945 генов белков

Таблица 5. Количество генов белков
ДНК + цепь - цепь
Chromosome I 1677 1635
Chromosome I 394 280
Plasmid (unnamed) 51 30

Также было установлено количество рибосомальных, гипотетических и транспортных белков и их процент от всех белков (таблица 6). Среди рибосомальных белков нет генов с одинаковыми названиями (list ribosomal proteins)

Таблица 6. Стандартные данные о геноме
Белки Количество Процент от всех белков
Рибосомальные белки 63 1.55%
Гипотетические белки 551 13.55%
Транспортные белки 228 5.61%

3. Анализ генов РНК

Всего в геноме содержится 135 генов РНК, что гораздо меньше, чем число генов белков (4067). Рибосомальных РНК 28, транспортных - 103.(Genome features, list RNA)

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

Таблица особенностей генома Genome Features
Страница в Google Colab, с программами, написанными на языке Python

СПИСОК ЛИТЕРАТУРЫ

1. Al Khudary R. et al. Pseudoalteromonas arctica sp. nov., an aerobic, psychrotolerant, marine bacterium isolated from Spitzbergen //International journal of systematic and evolutionary microbiology. – 2008. – Т. 58. – №. 9. – С. 2018-2024. doi.org/10.1099/ijs.0.64963-0

2. Offret C. et al. Spotlight on antimicrobial metabolites from the marine bacteria Pseudoalteromonas: chemodiversity and ecological significance //Marine drugs. – 2016. – Т. 14. – №. 7. – С. 129. doi.org/10.3390/md14070129

3. Lin X. et al. Biodegradation of crude oil by an Arctic psychrotrophic bacterium Pseudoalteromomas sp. P29 //Current microbiology. – 2009. – Т. 59. – №. 3. – С. 341-345. doi.org/10.1007/s00284-009-9440-9

4. ресурс, с которого взяты биоинформатические данные (сайт NCBI)

5. Belinky F, Rogozin IB, Koonin EV. Selection on start codons in prokaryotes and potential compensatory nucleotide substitutions. Sci Rep. 2017 Sep 29;7(1):12422. doi: 10.1038/s41598-017-12619-6 PMID: 28963504; PMCID: PMC5622118