Резюме
В работе содержится краткое описание генома бактерии Pseudomonas mosselii. В ходе исследования были изучены следующие темы: «Нуклеотидный состав генома», «Длины белков», «Место начала репликации в хромосоме Pseudomonas mosselii и место терминации репликации», «Типы генов», «Число гипотетических белков hypothetical protein», «Межгенные промежутки».
Введение
В этой работе рассматривается бактерия Pseudomonas mosselii. Род Pseudomonas является одной из самых разнообразных и экологически значимых групп бактерий на планете. Большой размер генома объясняет способность справляться с различными воздействиями внешних факторов (физических, химических и т.д.), приводящих к их широкому распространению. [1] P. mosselii – это новый вид, который был описан в 2002 г. [2] Эта палочковидная бактерия является возбудителем эндокардита. [3] Оптимальная температура для ее культивации - 30°C. Один из подвидов бактерии был получен из мочи пациента, страдающего алкогольным гепатитом, в больнице Шарля Николя. [4]
Таксономическая принадлежность
Таксон | Название | |
---|---|---|
Царство | Bacteria | |
Тип | Proteobacteria | |
Класс | Gammaproteobacteria | |
Порядок | Pseudomonadales | |
Семейство | Pseudomonadaceae | |
Род | Pseudomonas | |
Вид | Pseudomonas mosselii | |
Штамм | P. mosselii |
Место начала репликации в хромосоме Pseudomonas mosselii и место терминации репликации.
Рисунок 1.
График неоднородности гуанинов и цитозинов
Репликация – процесс удвоения ДНК.
Терминатор – место окончания репликации.
Ориджин – место начала репликации.
Исходя из полученных данных (рисунок 1):
- Точка максимума – 2825065, соответствует терминатору.
- Точка минимума – 1 нуклеотид, соответствует ориджину репликации.
Типы генов
Таблица 2.
Типы генов в геноме Pseudomonas mosselii
Проанализировав гены бактерии (таблица 2), была составлена таблица, показывающая количество типов генов в бактерии Pseudomonas mosselii.
Руководствуясь полученными данными, можно сделать следующие выводы:
2671 генов на обратной цепи
5209 генов на прямой цепи
больше всего кодирующих белков (стандартное явление)
Материалы и умения
Используемые функции и свойства:
1) Оформление строк и столбцов.
2) Работа с листами (создание, связка, перенос
данных с помощью ВПР)
3) Импорт данных из файлов формата txt.
4) Фильтр строк по значение.
5) Поиск по значению.
6) Сортировка.
7) СРЗНАЧ, МИН, МАКС, $.
Команды для кодомо:
1) wordcount - wordsize 1 – подсчет нуклеотидов в ДНК
2) wordcount - wordsize n. – подсчет ди- и три- меров в геноме
Результаты и обсуждение
Нуклеотидный состав генома:
Длина генома – 5742165 нуклеотидов, согласно базе данных сайта NCBI. Для генома бактерии такое число считается довольно внушительным.
Нуклеотид | Кол-во | |
---|---|---|
G | 1850381 | |
C | 1848672 | |
T | 1024316 | |
A | 1018796 |
Таблица 1.
Типы нуклеотидов и их количество
Комплементарные нуклеотиды примерно равны G ≈ C и T ≈ A. (таблица 1) Отсюда следует, что выполняется второе правило Чаргаффа.
Длины белков
(См. приложение 1)
На данной диаграмме показано количество белков разной длины в протеоме Pseudomonas mosselii. Руководствуясь полученными данными, можно сделать следующие выводы:
Больше всего белков лежит в промежутке 250-299 аминокислотных остатков
максимальная длина белка - 8452
минимальная длина белка - 23
БВ диапазоне 50–749 находится больше всего белков
Число гипотетических белков hypothetical protein
Общее число белков – 535. Это составляет 10,6% от всех белков бактерии. Отсюда можно сделать вывод, что эти белки играют большую роль из-за высокого содержания в бактерии. (см. сопроводительные материалы)
Межгенные промежутки
Рисунок 2.
Межгенные промежутки на комплементарной цепи
Из диаграммы межгенных промежутков комплементарной цепи (рисунок 2) можно сделать следующие выводы:
самый длинный промежуток – 36100
в промежутке 1-1000 находится больше всего генов (1606)
у 67 генов нет межгенных промежутков
334 гена «накладываются» друг на друга
Рисунок 3.
Межгенные промежутки на матричной цепи
Из диаграммы межгенных промежутков матричной цепи (рисунок 2) можно сделать следующие выводы:
Самый длинный промежуток 58372
В промежутке 1-1000 находится больше всего генов (1453)
У 69 генов нет межгенных промежутков
331 гена «накладываются» друг на друга
Для всего генома характерно содержание большого числа генов на промежутке 1-1000.
Благодарности
Факультету биоинженерии и биоинформатики МГУ за возможность выполнить данную работу.
Используемая литература
[1] Spiers AJ, Buckling A, Rainey PB: The causes of Pseudomonas diversity. Microbiology 2000
[2] Dabboussi F, Hamze M, Singer E, Geoffroy V, Meyer JM, Izard D: Pseudomonas mosselii sp. nov., a novel species isolated from clinical specimens. Int J Syst Evol Microbiol 2002
[3]Prosthetic valve endocarditis caused by Pseudomonas mosselii Elizabeth McLellan, David Partridge.
[4] Bodilis J, Calbrix R, Guerillon J, Merieau A, Pawlak B, Orange N, Barray S: Phylogenetic relationships between environmental and clinical isolates of Pseudomonas fluorescens and related species deduced from 16S rRNA gene and OprF protein sequences. Syst Appl Microbiol 2004, 27:93–108.
[5]Директория с данными о геноме Pseudomonas mosselii на портале NCBI
[6]Обзор бактерии на портале NCBI
[7]Сборка генома бактерии Pseudomonas mosselii на портале NCBI
[8]График (рисунок 1)
ПРИЛОЖЕНИЕ 1