В настоящей работе было проанализировано соотношение нуклеотидов в геноме бактерии Basilea psittacipulmonis. Также рассмотрены типы генов и их соотношение. Были сделаны выводы о соблюдении второго правила Чаргаффа, GСсдвиге, распределении длин белков и др.
Геном, протеом, белок, бактерия Basilea psittacipulmonis DSM 24701
Basilea psittacipulmonis была собрана с легкого мертвого попугая (Melopsittacus undulates) из зоомагазина города Ба́зель, Швейцария в 2007 году[1].
Позже стало известно, что это грамотрицательная микроаэрофильная мезофильная (развивающаяся при 30-37 C̊ ) бактерия[2]. По предварительной оценке не является патогенной[1]. В данном обзоре рассматриваются особенности генома и протеома B. psittacipulmonis с использованием простейших биоинформатических методов. Работа может положить начало другим исследованиям этой бактерии, которые позволят точно убедиться в том, что B. psittacipulmonis не наносит вреда попугаям.
Домен | Bacteria |
Отдел | Proteobacteria |
Класс | Betaproteobacteria |
Порядок | Burkholderiales |
Семейство | Alcaligenaceae |
Род | Basilea |
Вид | Basilea psittacipulmonis Whiteson et al. 2014 |
Геном (в формате .fasta) и таблица генов были скачаны с сайте NCBI[3]. При работе над обзором активно использовались электронные таблицы(ЭТ) Google sheets (функции: COUNTIFS, UNIQUE, ROUND, AVERAGE, STDEV, MEDIAN и др., диаграммы и некоторые таблицы). С помощью Python была написана программа для расчетов длины генома и соотношения нуклеотидов в нем .
Согласно данным NCBI весь доступный геном B. psittacipulmonis расположен только в хромосоме[3]. Размер генома составил 1 959 069 пар оснований(bp), что соответствует среднему размеру геномов бактерий – 2-5 Mbp(10^6 bp) [6].
Согласно полученным данным в исследуемом геноме количество нуклеотидов A ≈ T, G ≈ C. Это подтверждает второе правило Чаргаффа и принцип симметрии[7].
A | 29.7% |
T | 30.0% |
G | 20.1% |
C | 20.1% |
Также по полученным данным доля GC-пар составляет 40.3%. Как известно, повышенная доля GC-пар в ДНК увеличивает ее устойчивость к высоким температурам[5]. B. psittacipulmonis – мезофил, поэтому GC-сдвиг мы не наблюдаем.
Электронную таблицу с обработкой генома можно найти по ссылке. Для подсчетов гены были разделены на 8 групп (таблица 3). Согласно полученным данным большинство генов бактерии кодируют белок.
Также было подсчитано сколько генов расположено на «+»-цепи и сколько на «-»-цепи: 827 и 872, соответственно. Разница между полученными числами достаточно невелика, поэтому можно заключить, что гены расположены на двух цепям равномерно. Средняя длина гена у B. psittacipulmonis составляет 1024 bp, медианное значение 840 bp. Максимальная длина у гена белка из семейства YadA, 13155 bp; а минимальная у гена цистеиновой тРНК, 74 bp.
В ходе работы были рассмотрены белки бактерии. Среди 1639 молекул чаще всего встречаются белки с длиной цепи от 300 до 400 аминокислот(график 3). На графике наблюдается всего один крутой пик в указанной области. Подавляющее большинство генов имеет меньше 1000 аминокслотных остатка в своем составе.
В ходе анализа генома были подтверждены некоторые закономерности его устройства. Следует суммировать наиболее важные выводы:
1) Геном B. psittacipulmonis имеет среднюю длину
2) Соотношение нуклеотидов подтверждает правило Чаргаффа и соответствует условиям обитания данной бактерии (мезофил)
3) Гены распределены практически равномерно по «+» и «-» цепям.
Автор выражает благодарность своей бабушке, которая приготовила ему чай во время работы над обзором.