Мини-обзор генома бактерии Ancylobacter pratisalsi

Ибраева О. О.

Факультет биоинженерии и биоинформатики,
Московский Государственный Университет имени М. В. Ломоносова

Декабрь 2025


Аннотация

Данный мини-обзор представляет из себя работу с геномом бактерии Ancylobacter pratisalsi с использованием программирования на языке Python и функциональности электронных таблиц.

Введение

Ancylobacter pratisalsi — грамотрицательная аэробная и неподвижная бактерия из рода Ancylobacter, была выделена из ризосферной почвы подорожника зимнего (Plantago winteri Wirtg.) на естественном солончаковом лугу в рамках исследования ризосферных бактерий солеустойчивых видов растений и оценки их ростостимулирующих свойств. Клетки представляли собой палочки, неподвижные, аэробные [1].

Таксономическое положение [2]:

Материалы и методы

Данные о геноме Ancylobacter pratisalsi DSM 102029 были взяты с сайта NCBI Genomes [3]. Гистограммы распределения длин белков, распределения GC% состава и встречаемости аминокислот были построены с помощью MS Excel. С помощью языка Python 3.10 был проведен анализ кодирующих последовательностей генома для получения данных о GC-составе в различных белках и частоте встречаемости различных аминокислот. Для этого программой на языке python обходился файл в формате FASTA с последовательностями, кодирующими белки. Последовательность разбивалась на триплеты, создавался словарь, где ключом является аминокислота, определенная по таблице генетического кода, а значением — ее количество. На основе полученных данных была построена гистограмма с помощью MS Excel.

Результаты

1. Распределение длин белков бактерии Ancylobacter pratisalsi

На основе CDS (англ. coding sequence) бактерии были найдены длины всех белков. На гистограмме представлена зависимость количества белков к диапазону соответствующей длины.

Рисунок 1. Гистограмма длин белков Ancylobacter pratisalsi

Из рисунка 1 видно, что наиболее часто встречаются белки в диапазоне 250–300. Длины 1682 из 4708 белков имеет длину в диапазоне от 250 до 400 аминокислот. Исходя из полученных данных можно сделать следующие выводы: вероятнее всего, белки данной бактерии не образуют сложные третичные структуры, можно предположить, что заметная часть белков относится к ферментам со схожими функциями. Разница длин белков может определяться различиями в активных центрах ферментов. Кроме того, ферменты необходимо быстро синтезировать, поэтому для них оптимальна короткая длинна белка, для обеспечения быстрого клеточного ответа.

2. Распределение GC-состава (GC%) по CDS

На гистограмме представлена зависимость количества белков от диапазона значений GCсостава. Из рисунка 2 видно, что наибольшее количество белков имеет значение GC-состава в диапазоне 65,49–70,49.

Рисунок 2. Гистограмма GC-состава Ancylobacter pratisalsi

Высокий GC состав (65,49%–70,49%) коррелирует с тем, что местом обитания данной бактерии является корневая система травянистого растения, то есть верхние слои почвы. Из-за этого бактерия подвержена высокому УФ-излучению, для защиты от которого ей необходимы более прочные связи между комплементарными цепями ДНК.

3. Анализ частоты встречаемости аминокислот в геноме бактерии Ancylobacter pratisalsi

Гистограмма отображает количество различных аминокислот в геноме бактерии Ancylobacter pratisalsi. Из рисунка 3 видно, что аланин встречается чаще других аминокислот. Вторые и третьи аминокислоты по встречаемости лейцин и глицин.

Рисунок 3. Гистограмма встречаемости аминокислот Ancylobacter pratisalsi

Эти аминокислоты не содержат заряженных полярных групп, что косвенно подтверждает отсутствие сложной третичной структуры. Кроме того, белки, в которых преобладают такие аминокислоты будут плохо растворятся в воде и могут быть мембранными белками. Кроме того белки из аминокислот, имеющих короткий неразветвленный аминокислотный остаток, будут иметь небольшой размер, приемлемый для секретирования.

Сопроводительные материалы

  1. Программный код на языке Python 3.10 для получения GC-состава: GC_2.py
  2. Программный код на языке Python 3.10 для получения данных о частоте встречаемости различных аминокислот: count_aa.py
  3. Таблица MC Excel (1 лист – данные об особенностях генома Ancylobacter pratisalsi, 2 лист – данные для построения гистограммы распределения длин белков, 3 лист – данные для построения распределения GC-состава, 4 лист – данные для построения распределения частоты встречаемости аминокислот): hist.xlsx

Литература

  1. Suarez, C; Ratering, S; Schäfer, J; Schnell, S. Ancylobacter pratisalsi sp. nov. with plant growth promotion abilities from the rhizosphere of Plantago winteri Wirtg. International Journal of Systematic and Evolutionary Microbiology. 67 (11): 4500–4506. — 2017.
    doi:10.1099/ijsem.0.002320. PMID 28945527.
  2. NCBI Taxonomy: Ancylobacter pratisalsi DSM 102029
    https://www.ncbi.nlm.nih.gov/datasets/taxonomy/tree/?taxon=1745854
    (дата обращения: 07.12.2025).
  3. NCBI Genomes: Ancylobacter pratisalsi DSM 102029
    https://www.ncbi.nlm.nih.gov/datasets/taxonomy/1745854/
    (дата обращения: 07.12.2025).