Обзор генома бактерии Citrobacter tructae

Автор: Сучков Михаил

Аннотация

Данная работа является анализом генома бактерии Citrobacter tructae, с использованием методов программирования на языке Python и функционала электронных таблиц.

Введение

Citrobacter — это грамотрицательные палочковидные бактерии из типа Proteobacteria, семейства Enterobacteriaceae. Клетки длинные, палочковидные, обычно 1–5 мкм в длину, с жгутиками для передвижения. Citrobacter tructae была выделена из почек больной радужной форели (Oncorhynchus mykiss) [1].

В настоящем мини-обзоре рассматриваются и анализируются базовые особенности генома и протеома бактерии с помощью биоинформатических методов. Исследуются кодирующие белок последовательности, пересечения кодирующих участков генов, а также нуклеотидные последовательности псевдогенов.

Методы

Информация о геноме бактерии была взята с данного сайта: NCBI Genomes.

Для анализа данных использовались программы, написанные на языке программирования Python, и также применялись электронные таблицы Google Sheets. В них были использованы функции: ЕСЛИ, СУММ, =СЧЁТЕСЛИМН и фильтр. Ссылки на программы Python можно найти в разделе "Сопроводительные материалы".

Результаты

Описание длин белков бактерии

Из таблицы cds_from_genomic были получены длины белков. С помощью Google Sheets эти данные были представлены в виде гистограммы (рисунок 1).

По рисунку 1 видно, что самая частая длина белка у бактерии Citrobacter tructae имеет длину 200–300 аминокислот, причем более 90% белков имеют длину от 0 до 600 аминокислот. А всего белков 4577.

Описание пересечений генов бактерии

Из таблицы feature table были получены номера старт-кодонов и стоп-кодонов. При помощи Google Sheets было посчитано количество нуклеотидов в пересечениях кодирующих участков генов на положительной цепи ДНК бактерии Citrobacter tructae (рисунок 2).

По рисунку 2 видно, что самое частое количество нуклеотидов при пересечении находится в диапазоне 0–10, и чем больше нуклеотидов в пересечении, тем реже такое пересечение будет встречаться.

Анализ стоп-кодонов псевдогенов

Из таблицы cds_from_genomic с помощью программы на языке Python были получены псевдогены и проведен анализ их стоп-кодонов. Полученные данные находятся в файле stop_codons.txt и представлены в виде таблицы и гистограмм. Всего было найдено 90 псевдогенов.

По таблице 1 видно, что 40% псевдогенов утратили стоп-кодон в конце гена, а количество преждевременных стоп-кодонов больше, чем стоп-кодонов в конце гена.

В конце гена	В остальном участке гена
Стоп-кодоны	51	180
Не стоп-кодоны	39	-

По рисунку 3 видно, что самым часто встречающимся преждевременным стоп-кодоном является TGA, а TAA и TAG встречаются намного реже.

Гистограмма преждевременных стоп-кодонов

По рисунку 4 видно, что самым часто встречающимся стоп-кодоном в конце псевдогена является TAA, TGA встречается чуть реже. Это существенно отличается от показателей преждевременных стоп-кодонов.

Гистограмма стоп-кодонов в конце псевдогенов

Сопроводительные материалы

Литература

Jung W. J. et al. Citrobacter tructae sp. nov. isolated from kidney of diseased rainbow trout (Oncorhynchus mykiss) //Microorganisms. – 2021. – Т. 9. – №. 2. – С. 275.
Tutar Y. Pseudogenes //International Journal of Genomics. – 2012. – Т. 2012. – №. 1. – С. 424526.
Wang X. et al. Efficient gene silencing by adenine base editor-mediated start codon mutation //Molecular Therapy. – 2020. – Т. 28. – №. 2. – С. 431-440.

Благодарности

Сучкову Б.А. за ежедневную моральную поддержку.
Спирину С.А. за исправления и корректировки.
Куликову Антону за исправления и корректировки.
Гришину Вадиму за исправления и корректировки.
Петрушко Ивану за корректировки.
Бритвину А.А. за исправление ошибки в коде.