Краткий обзор генома бактерии
Pseudomonas mosselii

Резюме

В работе содержится краткое описание генома бактерии Pseudomonas mosselii. В ходе исследования были изучены следующие темы: «Нуклеотидный состав генома», «Длины белков», «Место начала репликации в хромосоме Pseudomonas mosselii и место терминации репликации», «Типы генов», «Число гипотетических белков hypothetical protein», «Межгенные промежутки».


Введение

В этой работе рассматривается бактерия Pseudomonas mosselii. Род Pseudomonas является одной из самых разнообразных и экологически значимых групп бактерий на планете. Большой размер генома объясняет способность справляться с различными воздействиями внешних факторов (физических, химических и т.д.), приводящих к их широкому распространению. [1] P. mosselii – это новый вид, который был описан в 2002 г. [2] Эта палочковидная бактерия является возбудителем эндокардита. [3] Оптимальная температура для ее культивации - 30°C. Один из подвидов бактерии был получен из мочи пациента, страдающего алкогольным гепатитом, в больнице Шарля Николя. [4]


Таксономическая принадлежность

Таксон Название
Царство Bacteria
Тип Proteobacteria
Класс Gammaproteobacteria
Порядок Pseudomonadales
Семейство Pseudomonadaceae
Род Pseudomonas
Вид Pseudomonas mosselii
Штамм P. mosselii

Место начала репликации в хромосоме Pseudomonas mosselii и место терминации репликации.

Питер

Рисунок 1.
График неоднородности гуанинов и цитозинов

Репликация – процесс удвоения ДНК.
Терминатор – место окончания репликации.
Ориджин – место начала репликации.
Исходя из полученных данных (рисунок 1):
- Точка максимума – 2825065, соответствует терминатору.
- Точка минимума – 1 нуклеотид, соответствует ориджину репликации.

Типы генов

Питер

Таблица 2.
Типы генов в геноме Pseudomonas mosselii

Проанализировав гены бактерии (таблица 2), была составлена таблица, показывающая количество типов генов в бактерии Pseudomonas mosselii.
Руководствуясь полученными данными, можно сделать следующие выводы:

  • 2671 генов на обратной цепи

  • 5209 генов на прямой цепи

  • больше всего кодирующих белков (стандартное явление)

Материалы и умения

Используемые функции и свойства:
1) Оформление строк и столбцов.
2) Работа с листами (создание, связка, перенос данных с помощью ВПР)
3) Импорт данных из файлов формата txt.
4) Фильтр строк по значение.
5) Поиск по значению.
6) Сортировка.
7) СРЗНАЧ, МИН, МАКС, $.


Команды для кодомо:
1) wordcount - wordsize 1 – подсчет нуклеотидов в ДНК
2) wordcount - wordsize n. – подсчет ди- и три- меров в геноме


Результаты и обсуждение

Нуклеотидный состав генома:
Длина генома – 5742165 нуклеотидов, согласно базе данных сайта NCBI. Для генома бактерии такое число считается довольно внушительным.

Нуклеотид Кол-во
G 1850381
C 1848672
T 1024316
A 1018796

Таблица 1.
Типы нуклеотидов и их количество

Комплементарные нуклеотиды примерно равны G ≈ C и T ≈ A. (таблица 1) Отсюда следует, что выполняется второе правило Чаргаффа.


Длины белков

(См. приложение 1)
На данной диаграмме показано количество белков разной длины в протеоме Pseudomonas mosselii. Руководствуясь полученными данными, можно сделать следующие выводы:

  • Больше всего белков лежит в промежутке 250-299 аминокислотных остатков

  • максимальная длина белка - 8452

  • минимальная длина белка - 23

  • БВ диапазоне 50–749 находится больше всего белков


Число гипотетических белков hypothetical protein

Общее число белков – 535. Это составляет 10,6% от всех белков бактерии. Отсюда можно сделать вывод, что эти белки играют большую роль из-за высокого содержания в бактерии. (см. сопроводительные материалы)


Межгенные промежутки

Питер

Рисунок 2.
Межгенные промежутки на комплементарной цепи

Из диаграммы межгенных промежутков комплементарной цепи (рисунок 2) можно сделать следующие выводы:

  • самый длинный промежуток – 36100

  • в промежутке 1-1000 находится больше всего генов (1606)

  • у 67 генов нет межгенных промежутков

  • 334 гена «накладываются» друг на друга

Питер

Рисунок 3.
Межгенные промежутки на матричной цепи

Из диаграммы межгенных промежутков матричной цепи (рисунок 2) можно сделать следующие выводы:

  • Самый длинный промежуток 58372

  • В промежутке 1-1000 находится больше всего генов (1453)

  • У 69 генов нет межгенных промежутков

  • 331 гена «накладываются» друг на друга

Для всего генома характерно содержание большого числа генов на промежутке 1-1000.

Благодарности

Факультету биоинженерии и биоинформатики МГУ за возможность выполнить данную работу.


Используемая литература

[1] Spiers AJ, Buckling A, Rainey PB: The causes of Pseudomonas diversity. Microbiology 2000

[2] Dabboussi F, Hamze M, Singer E, Geoffroy V, Meyer JM, Izard D: Pseudomonas mosselii sp. nov., a novel species isolated from clinical specimens. Int J Syst Evol Microbiol 2002

[3]Prosthetic valve endocarditis caused by Pseudomonas mosselii Elizabeth McLellan, David Partridge.

[4] Bodilis J, Calbrix R, Guerillon J, Merieau A, Pawlak B, Orange N, Barray S: Phylogenetic relationships between environmental and clinical isolates of Pseudomonas fluorescens and related species deduced from 16S rRNA gene and OprF protein sequences. Syst Appl Microbiol 2004, 27:93–108.

[5]Директория с данными о геноме Pseudomonas mosselii на портале NCBI

[6]Обзор бактерии на портале NCBI

[7]Сборка генома бактерии Pseudomonas mosselii на портале NCBI

[8]График (рисунок 1)


ПРИЛОЖЕНИЕ 1

Питер