Обзор генома и протеома бактерии Psychromicrobium lacuslunae

Волобуев Лев Андреевич

Факультет Биоинженерии и биоинформатики

Московский государственный университет им. М. В. Ломонмсова

Аннотация

В данной работе обозревается геном и протеом бактерии, с помощью методов электронных таблиц и языка Python.

Введение

Psychromicrobium lacuslunae – представитель филлума Actinomycetota (Таблица 1), грамположительная бактерия, выделенная из подповерхностного слоя воды озера Чандра-Тал в долине Лахаул-Спити индийских Транс Гималаев [1]. Данный вид является психрофильным и алкалифильным организмом. Клетки неподвижны, аэробны, каталаза-положительны и оксидаза-отрицательны. P. lacuslunae растет в диапазоне температур от 5 до 37 °C (оптимум 28 °C), значений pH от 5,0 до 12,0 (оптимум pH 7,0) и в присутствии до 8% NaCl (оптимум 1%) [1]. Филогенетический анализ нуклеотидной последовательности гена 16S рРНК показал наибольшее сходство с видами Psychromicrobium silvestre, Arthrobacter russicus и Renibacterium salmoninarum [1]. Строение пептидогликана клеточной стенки было отнесено к типу A3α с пептидным мостиком L-Lys-L-Thr-L-Ala и замещением α-карбоксильной группы D-Glu амидом аланина, что типично для представителей рода Psychromicrobium [1].

Материалы и методы

Информация о геноме и транслированных CDS P. lacuslunae была взята с сайта NCBI [3]. Дальнейший анализ проводился с помощью электронных таблиц (см. S1, S2) и скриптов написанных на Python.

Результаты

Были проанализированы длины белков, содержание GC в CDS, определены все стоп кодоны в CDS, проведено сравнение определенных кодирующих последовательностей P. lacuslunae, родственной ей бактерии Psychromicrobium silvestre, и психрофильной бактерии Flavobacterium psychrophilum (Bacteroidota).

Длины белков

В ходе работы была выполнена оценка количества белков определенной длины. Результаты представлены в виде гистограммы (рис. 1). Большая часть белков бактерии имеет длину от 110 до 380 аминокислот (медиана 288).

Рис. 1 Распределение белков по длинам.

Процентное содержание GC по CDS

Также был изучен процент GC в CDS бактерии P. lacuslunae. Результат представлен на гистограмме (рис. 2). В большинстве CDS процент GC составляет 58.5-61.5% (медиана 59.35%), такое высокое содержание GC характерно для представителей рода Psychromicrobium[1].

Рис. 2 Распределение CDS по проценту GC.

Определение стоп-кодонов

Для определения стоп кодонов в CDS бактерии P. lacuslunae был написан скрипт на Python (см. S3.1). Определение стоп кодонов шло отдельно для нормальных генов и псевдогенов (Таблица 2). Мы видим, что в псевдогенах имеются неклассические стоп кодоны, которые отличаются от обычных заменой нуклеотидов в 1-й или 3-й позиции, это можно объяснить тем, что псевдогены не экспрессируются, вследствии чего в них происходит быстрое накопление мутаций [4].

Сравнение CDS психрофильных бактерий

Было проведено сравнение CDS, кодирующих мембранные белки психрофильных бактерий: Psychromicrobium lacuslunae, Psychromicrobium silvestre (см. S4.1) и Flavobacterium psychrophilum (см. S4.2) (информация последовательностях P. silvestre и F. psychrophilum была взята с сайта NCBI [3]). Для сравнения был написан скрипт на Python (см. S3.2), который вырезал последовательность из FASTA файла с последовательностями CDS, подсчитывал количество нуклеотидов, нуклеотидный состав и процент содержания GC (Таблица 3). Видно что представителей Psychromicrobium отличает от другой психрофильной бактерии высокий процент GC в CDS [1].

Аминокислотный состав неопознанных белков

В геноме P. psychromicrobium было обнаружено 393 CDS (см. S2), чьи последовательности могут кодировать белки, экспрессия которых еще не была обнаружена в клетке (hypothetical protein). С помощью языка Python был написан скрипт (см. S3.3), который подсчитывает аминокислоты с различными типами боковых цепей (полярных заряженных, полярных незаряженных и неполярных незаряженных) (Таблица 4). Полная выдача скрипта записана в файл (см. S5). По результатам выдачи были построены гистограммы распределения белков по содержанию различных типов аминокислот (рис. 3). Видно что для первой и второй гистограмм мода составляет 20 и 24 соответственно. То есть большинство гипотетических белков содержат полярные аминокислоты (заряженные и незаряженные) в практически равных количествах. Для третей гистограммы мода составляет 80, это говорит о том, что в большинстве белков неполярных аминокислот больше, чем полярных. Полученные данные ввиду плохой изученности Psychmicrobium lacuslunae могут помочь в изучении функций этих белков.

Рис. 3 Распределение белков по количеству аминокислот с определенным типом боковой цепb

Сопроводительные материалы

  1. S1. Таблица CDS of genome Psychromicrobium lacuslunae, содержащая информацию о длине белков и %GC
  2. S2. Таблица Genomic features of Psychromicrobium lacuslunae, содержащая информацию о CDS, кодирующих гипотетические белки
  3. S3. Среда Colab с написанными скриптами
    1. S3.1 Определение стоп-кодонов
    2. S3.2 Сравнение CDS
    3. S3.3 Определение аминокислотного состава
  4. S4. Сборки геномов P. silvestre и F. psychrophilum
    1. S4.1. P. silvestre
    2. S4.2. F. psychrophilum
  5. S5. Выдача скрипта из S3.3

Литература

  1. Kiran S. et al. Psychromicrobium lacuslunae sp. nov., isolated from a high altitude lake //International Journal of Systematic and Evolutionary Microbiology. – 2018. – Т. 68. – №. 11. – С. 3416-3423
  2. Информация о P. lacuslunae в Taxonomy Browser
  3. Файлы с геномом и транслированным CDS P. lacuslunae на NCBI
  4. Rau D. et al. Identification and structural characterization of pseudogenes in Fusarium graminearum //Scientific Reports. – 2025. – Т. 15. – №. 1. – С. 27773.