Исследование генома бактерии Marinobacter hydrocarbonoclasticus ATCC 49840

Шаповалов И.С.

1 курс ФББ МГУ им. Ломоносова

Резюме

В данной работе был рассмотрен геном и протеом бактерии Marinobacter hydrocarbonoclasticus ATCC 49840

Ключевые слова

Расщепляет линейные углеводороды

Введение

В данной работе хотелось бы рассмотреть протеом такой особи, как Marinobacter hydrocarbonoclasticus. Данная бактерия является представителем протеобактерий, а именно относится к гамма-протеобактериям. Что означает, что данная бактерия является не только грамм-отрицательной, но и палочковидной, при этом клетки этих бактерий имеют один жгутик. Однако способность к отращиванию жгутика зависит от концентрации NaCl в окружающей среде, а именно они способны к данному действию только при концентрации от 0,6 до 1,5 М.[1]

Стоит отметить уникальную особенность этих бактерий. А именно, они используют нециклические углеводороды как субстрат роста. Это вызвано тем, что в их клетках отсутствует один из важнейших ферментов для разложения циклических углеводородов.[1] Эта особенность раскрывает актуальность изучения данных бактерий, ведь линейные углеводороды являются ключевыми компонентами нефти и машинного топлива. Поэтому они очень важны с экологической точки зрения, так как могут помочь минимизировать ущерб окружающей среде от различных поломок на нефтедобывающих станциях или на различных судах, которые терпят крушения в мировом океане.[2]

Систематическое положение
Таксон Название
Домен Bacteria
Группа Proteobacteria
Класс Gammaproteobacteria
Порядок Alteromonadales
Семейство Alteromonadaceae
Род Marinobacter
Вид Marinobacter hydrocarbonoclasticus
Штамм ATCC 49840

Методы и материалы

Данные для работы были взяты из базы данных:Data

Информация о геноме была скачана в виде:GCF_000284615.1_ASM28461v1_feature_table.txt.gz

Сам геном был скачан файлом, который был конвертирован в fasta формат:GCF_000284615.1_ASM28461v1_genomic.fna.gz

Также использовались электронные таблицы и язык программирования Python.

В данной работе использовались следующие умения:

  1. Импортирование данных из txt-файла
  2. Фильтр строк по значению
  3. Создание новых листов, их связь между собой
  4. Копирование и вставка (В том числе специальная вставка по значениям)
  5. Перенос данных между листами с помощью функции ВПР
  6. Сортировка
  7. Оформление таблицы

Посредством работы с таблицей генома была построена гистограмма со сравнением числа генов определенной длины (диапазон для обобщения белков взят равным 100 азотистым основаниям).

Диаграмма 1 Сравнение длин всех генов бактерии

Также был проведен анализ продуктов генов и расположения генов на цепочках. Из таблицы на Диаграмме 2 видно, что число генов на прямой и на обратной цепочках ДНК приблизительно равны, что дает право говорить о равномерном распределении.

Еще один критерий, который был рассмотрен, - число определенных азотистых оснований в геноме. Подсчет был выполнен программой, написанной на языке Python, которая приложена к работе в сопроводительных материалах. На основании результата работы программы была построена круговая диаграмма, показывающая соотношение числа азотистых оснований. Исходя из полученных результатов, мы находим подтверждение второму правилу Чаргаффа, а именно, подтверждение тому, что количество гуанина примерно равно количеству цитозина на одной цепочке ДНК.

Из этих же результатов был посчитан GC-состав. Данный показатель цепочки ДНК говорит об устойчивости к денатурации, так как гуанин с цитозином связаны тремя водородными связями, а аденин с тимином двумя. Данный показатель равен 57,4%, что говорит о достаточно высокой прочности данного генома.

Однако еще одной характеристикой прочности цепочки ДНК являются стекинг-взаимодействия между соседними нуклеотидами.[3]

Известно, что сила взаимодействия больше всего в паре пурин-пурин и меньше всего в паре пиримидин-пиримидин. Поэтому, исходя из полученных данных, можно говорить о том, что ДНК данного организма является достаточно устойчивой, так как пары со слабым стекинг-взаимодействием находятся в меньшинстве. Данные для построения этой диаграммы были посчитаны с помощью программы kmer_count.py, написанной мной на языке программирования Python, данная программа приложена в сопроводительных материалах.

Для удобства анализа протеома также была построена гистограмма со сравнением числа белков определенной длины (диапазон для обобщения белков взят равным 50 аминокислот).

Количество генов по типам Тип цепочки кодирования
Типы кодируемых структур - + Общий итог
ncRNA 1 1
protein_coding 1707 1875 3582
pseudogene 14 14 28
RNase_P_RNA 1 1
rRNA 3 6 9
SRP_RNA 1 1
tmRNA 1 1
tRNA 20 30 50
Общий итог 1744 1929 3673
Диаграмма 2 Сравнение типов генов и их расположения(- обратная цепочка ДНК, + прямая цепочка ДНК)
Диаграмма 3 Сравнение числа определенных азотистых оснований в геноме
Диаграмма 4 Сравнение числа определенных 2-меров, которые влияют на стекинг-взаимодействие
Диаграмма 5 Сравнение длин белков бактерии

Выводы

По итогу работы были проанализированы геном и протеом бактерии Marinobacter hydrocarbonoclasticus ATCC 49840, были освоены навыки работы с ЭТ и языком программирования Python, а также самостоятельно найдены подтверждения тех правил, которые ранее давались без доказательств, а также были собраны данные, которые могут найти реализацию в будущих исследованиях и работах.

Благодарности

Данная работа была написана благодаря Факультету Биоинженерии и Биоинформатики Московского Государственного Университета им. М.В.Ломоносова (ФББ МГУ).

Список литературы

Ресурс с базой данных Data

  1. Gauthier; Lafay; Christen; Fernandez; Acquaviva (October 1992). "Marinobacter hydrocarbonoclasticus gen. nov., sp. nov., a new, extremely halotolerant, hydrocarbon-degrading marine bacterium". International Journal of Systematic Bacteriology.
  2. Hamdan, Leila; Fulmer, Preston (March 2011). "Effects of COREXIT EC9500A on bacteria from a beach oiled by the Deepwater Horizon spill". Aquatic Microbial Ecology.
  3. Yakovchuk P., Protozanova E., Frank-Kamenetskii M. D. Base-stacking and base-pairing contributions into thermal stability of the DNA double helix. Nucleic Acids Research journal.