Гамма-протеобактерия Pseudoalteromonas arctica является строго аэробной гетеротрофной морской криофильной бактерией, впервые выделена из образцов арктической морской воды, взятых в Шпицбергене (Норвегия). Клетки прямые, палочковидные, грамотрицательные, шириной 0,15-0,2 мкм и длиной 0,4-0,7 мкм. Не образуют спор, встречаются поодиночке, оптимальная температура для роста - 10-15 °C [1]. Бактерии рода Pseudoalteromonas представляют интерес для исследователей, потому что многие виды синтезируют широкий спектр различных антимикробных метаболитов (алкалоиды, поликетиды, пептиды) и играют важную экологическую роль, являясь частью постоянной микробиоты некоторых макроорганизмов (Cnidaria, Porifera, других?)[2], некоторые виды обладают способностью к биодеградации нефтяных углеводородов [3].
В данной работе для вида Pseudoalteromonas arctica A 37-1-2 проведен анализ стандартных данных каждой ДНК, приведены статистические данные о белках протеома и генах РНК.
Данные о об особенностях генома взяты с сайта NCBI (Национальный центр биотехнологической информации США) [4]. Анализ генома и протеома проводился с помощью электронных таблиц Google Sheets и программ, написанных на языке Python, данные о бактерии были загружены в таблицу особенностей генома с названием Genome Features.
Геном бактерии состоит из двух кольцевых хромосом и кольцевой плазмиды (таблица 1). Данные о длине каждой ДНК и GC составе взяты с ресурса [4]. Предположительно, у криофильных бактерий, адаптированных к жизни в низких температурах, GC состав будет ниже средних значений (менее 50 процентов), что соответствует полученным результатам (колонии Pseudoalteromonas arctica растут уже при температуре 4°C, общий GC-процент составляет 39).
| ДНК | Длина в п.н. | GC состав |
|---|---|---|
| Chromosome I | 3840834 | 39.5% |
| Chromosome I | 783876 | 38.5% |
| Plasmid (unnamed) | 97261 | 38.5% |
С помощью программы на языке Python (см. Сопроводительные материалы, Программа 2) получил количество встретившихся старт-кодонов (таблица 2). Чаще всего используется кодон ATG, реже, но тоже часто используются кодоны GTG и TTG, остальные кодоны используются гораздо реже. Вероятно, это происходит потому, что GTG и TTG очень похожи на канонический старт кодон ATG (отличается только один нуклеотид) и мутация слабо повлияла на экспрессию гена или была компенсирована мутациями в последовательности Шайна — Дальгарно [5]. Старт кодоны, встретившиеся только один раз, за редким исключением, находятся на псевдогенах
| ATG | GTG | TTG | остальные кодоны | |
|---|---|---|---|---|
| Количество встретившихся старт-кодонов | 3626 | 297 | 160 | AAA 1, AAC 1, AAT 2, ACA 3, ACC 1, AGT 1, ATA 9, ATC 5, ATT 10, CAA 1, CCT 1, CGT 1, CTA 1, CTG 2, GAC 1, GAG 1, GAT 1, GCC 1, GGA 1, GGT 1, GTC 1, TGG 1, TTA 2, TTT 1 |
С помощью программы, написанной на языке Python (см.Сопроводительные материалы, Программа 1) получил количество встретившихся стоп-кодонов (Таблица 2). Каждый из трех стоп кодонов встретился множество раз, значит они точно не выполняют кодирующую функцию. Преобладающим оказался кодон TAA, его встречаемость примерно втрое превышает TGA и TAG вместе взятых.
| TGA | TAA | TAG | |
|---|---|---|---|
| Количество встретившихся стоп-кодонов | 459 | 2979 | 673 |
С помощью электронных таблиц было получено распределение длин белков (Гистограмма 1).
Также были определены среднее значение, медиана, стандартное отклонение (среднее квадратичное отклонений данных от среднего значения), минимальное и максимальное значения длин (таблица 4). Интересным наблюдением оказалось то, что самый крупный белок имеет длину 7102 аминокислот и содержит иммуноглобулин-подобный домен.
| Среднее значение | 332, |
| Стандартное отклонение | 250,8 |
| Медиана | 279 |
| Минимальное значение | 22 |
| Максимальное значение | 7102 |
С помощью таблицы особенностей генома (list CDS) был проведен анализ количества генов белков, закодированных на прямой и комплементарной цепочке (для каждой ДНК), результаты представлены в таблице 5. Всего на прямой цепи находится 2122 генов белков, на комплементарной цепи - 1945 генов белков
| ДНК | + цепь | - цепь |
|---|---|---|
| Chromosome I | 1677 | 1635 |
| Chromosome I | 394 | 280 |
| Plasmid (unnamed) | 51 | 30 |
Также было установлено количество рибосомальных, гипотетических и транспортных белков и их процент от всех белков (таблица 6). Среди рибосомальных белков нет генов с одинаковыми названиями (list ribosomal proteins)
| Белки | Количество | Процент от всех белков |
|---|---|---|
| Рибосомальные белки | 63 | 1.55% |
| Гипотетические белки | 551 | 13.55% |
| Транспортные белки | 228 | 5.61% |
Всего в геноме содержится 135 генов РНК, что гораздо меньше, чем число генов белков (4067). Рибосомальных РНК 28, транспортных - 103.(Genome features, list RNA)
Таблица особенностей генома Genome Features
Страница в Google Colab, с программами, написанными на языке Python
1. Al Khudary R. et al. Pseudoalteromonas arctica sp. nov., an aerobic, psychrotolerant, marine bacterium isolated from Spitzbergen //International journal of systematic and evolutionary microbiology. – 2008. – Т. 58. – №. 9. – С. 2018-2024. doi.org/10.1099/ijs.0.64963-0
2. Offret C. et al. Spotlight on antimicrobial metabolites from the marine bacteria Pseudoalteromonas: chemodiversity and ecological significance //Marine drugs. – 2016. – Т. 14. – №. 7. – С. 129. doi.org/10.3390/md14070129
3. Lin X. et al. Biodegradation of crude oil by an Arctic psychrotrophic bacterium Pseudoalteromomas sp. P29 //Current microbiology. – 2009. – Т. 59. – №. 3. – С. 341-345. doi.org/10.1007/s00284-009-9440-9
4. ресурс, с которого взяты биоинформатические данные (сайт NCBI)
5. Belinky F, Rogozin IB, Koonin EV. Selection on start codons in prokaryotes and potential compensatory nucleotide substitutions. Sci Rep. 2017 Sep 29;7(1):12422. doi: 10.1038/s41598-017-12619-6 PMID: 28963504; PMCID: PMC5622118