Обзор генома бактерии Bacillus safensis

Многие проблемы клеточной биологии можно решить, используя методы компьютерного моделирования. Они позволяют понять различные клеточные процессы. В настоящее время разработано множество алгоритмов, позволяющих добиться нужных результатов.

Введение

Общая информация

Bacillus safensis является грамположительной бактерией - палочкой, образующей споры. Она принадлежит к крупному широко распространенному роду Bacillus. Исследуемая бактерия является аэробным хемогетеротрофом, обладающий высокой устойчивостью к УФ - излучению. Размер клеток колеблется от 0,5 до 0,7 мкм в диаметре и 1,0-1,2 мкм в длину. Этот вид подвижен и использует полярные жгутики для передвижения. Клетки могут расти при температуре 10-50 ° C.[1]

Почему для изучения выбран именно этот объект?

Первоначально он был описан как устойчивый загрязнитель на сборочном предприятии космических кораблей в Лаборатории реактивного движения, США, откуда он и получил свой специфический эпитет - safensis. Бактерия обладает некоторыми свойствами, способствующими росту растений. Объект изучения содержит гены, кодирующие фермент, который способен генерировать 2-оксобутоноат и аммиак путем расщепления предшественника растительного гормона. Это позволяет растению переносить тяжелые металлы и соли. Благодаря этим свойствам бактерия - продуцент растительных гормонов, а также является потенциально ценным объектом в области биотехнологии. Именно это и вызвало интерес к изучению данного объекта.[2]

Bacillus safensis
Рис. 1. Фотография колонии бактерии Bacillus safensis[3]

Методы

Для составления общей характеристики генома использовала методы программирования. Писала код на языке Python:

Для исследования протеома я использовала различные функции Google таблиц:

Результаты

Общая характеристика генома

Мною было посчитано количество ДНК у бактерии Bacillus safensis. С помощью методов программирования мне удалось выяснить, что исследуемая мною бактерия имеет одну кольцевую ДНК. Она содержит 3786744 нуклеотида. Рассчитанный мною GC-состав равен 41,67%. Мне удалось заметить, что эта величина довольно близка к GC - составу родственной бактерии Bacillus pumilus - 41%. В ходе исследования генома я посчитала количество всех нуклеотидов. Результаты расчетов для наглядности отразила в Таблице 1.

Таблица 1
Нуклеотид A T C G
Кол-во в геноме (шт.) 110699 1102291 788065 789389
Процентное содержание в геноме 0,2923 0,2912 0,2081 0,2085

На основе полученных данных могу сделать вывод о том, что второе правило Чаргаффа работает.

Состав генов

Выявлены состав генов на прямой и обратной цепи ДНК. Результаты расчетов приведены в Таблице 2.

Таблица 2
Тип гена + - всего
Protein coding 1917 1768 3685
ncRNA 2 0 2
rRNA 3 21 24
SRP_RNA 0 1 1
tmRNA 1 0 1
tRNA 27 54 81
pseudogene 15 17 32

По результатам исследований можно сделать вывод о равномерности или неравномерности распределения генов по цепям ДНК. По результатам своего исследования могу сделать вывод о том, что белки распределены по обеим цепям довольно равномерно. Но это распределение получилось случайным образом. В доказательство привела расчеты в таблице в приложении (“для обзора”). Стоит отметить, что tRNA и rRNA распределены по обеим цепям неравномерно.

Гистограмма длин белков

С помощью программы Excel сделала гистограмму длин белков (Диаграмма 2), включающую в себя длину кармана (равную 40) и количество белков, попадающих в данный диапазон. Можно заметить, что наиболее часто встречаются белки с длинной 100 - 200 нуклеотидов.

Диаграмма №1
Диаграмма 1

Распределение tRNA по цепям ДНК

Bacillius safensis имеет 81 tRNA на двух цепях ДНК. Я решила проанализировать, какие виды tRNA имеются в исследуемой ДНК, на каких цепях расположены и в каком количестве. Для наглядности я составила диаграмму.

Диаграмма №2
Диаграмма 2

Проанализировав результаты, сделала вывод, что некоторые триплеты, кодирующие тРНК, встречаются в последовательности в “избыточном” количестве. К примеру, tRNA-met кодируется лишь одним триплетом. Однако он встречается в цепи ДНК на прямой и обратной цепи больше одного раза. Произошло это по причине того, что триплет, кодирующий аминокислоту метионин используется как старт-кодон, а так же как стандартный триплет в последовательности. Именно поэтому для успешного синтеза белка его требуется больше, чем остальных кодонов.

Подобную закономерность “избыточности” я заметила и у других генов тРНК:

Объяснить подобное можно тем, что бактерия Bacillius safensis нуждается в разных аминокислотах в разном количестве. Поэтому некоторые триплеты, кодирующие опредетенный тип тРНК встречаются чаще, чем другие, т.к организм больше нуждается в них.

Использованные источники

  1. Источник [1]
  2. Lateef, A., Adelere, I.A. & Gueguim-Kana, E.B. The biology and potential biotechnological applications of Bacillus safensis. Biologia 70, 411–419 (2015). Источник [2]
  3. Изображение взято с сайта: Источник [3]