КРАТКИЙ ОБЗОР

БИОИНФОРМАТИКА

Обзор генома и протеома бактерии Dehalococcoides mccartyi

Тычкова Екатерина

Факультет биоинженерии и биоинформатики, Московский государственный университет имени М. В. Ломоносова, Ленинские горы д. 1 стр. 73, 119234, Москва, Россия

14 декабря 2020 года

РЕЗЮМЕ

Данная работа представляет собой анализ протеома и генома, общих биологических особенностей бактерии Dehalococcoides mccartyi (D. mccartyi). В процессе выполнения работы мною было установлено число генов, кодирующих белки, транспортные, рибосомальные и другие типы РНК, классы нуклеотидов и их различное соотношение, а также исследование аминокислотного состава протеома.

Ключевые слова: Dehalococcoides mccartyi, органо-галогенидное дыхание, геном.

1.ВВЕДЕНИЕ

D. mccartyi - бактерии рода Dehalococcoidia, способны к облигатному органо-галогенидному дыханию и не используют ферментацию и другие известные механизмы метаболизма [3]. Субстратом являются разнообразные органические соединения, такие как полихлорированные бифенилы или дибензо-п-диоксины, хлорированные эфины, включая перхлорэтен (PCE) и трихлорэтен (TCE) [1,2]. Данные вещества входят в список стойких загрязнителей окружающей среды и канцерогенов [2]. Органогалогенидная регенерирующая способность штамма Dehalococcoides mccartyi представляет собой практическую ценность для биовосстановления подземных водоносных горизонтов, загрязненных подобными промышленными растворителями и, следовательно, сокращения риска возникновения рака [2].

2.МАТЕРИАЛЫ И МЕТОДЫ

Работа проводилась с геномом бактерии, взятым из базы данных NSBI [4]. Дальнейшая работа проводилась с использованием следующих навыков:

  1. Работа с Google Docs and Tables:
    • Импортирование текстовых файлов;
    • Применение функций: “Фильтр”;
    • Сортировка данных по значению, перемещение столбцов;
    • Редактирование формата таблицы;
    • Использование спец символов и формул и функций: $,ПОИСКПОЗ, ВПР, СЧЁТЕСЛИ и СЧЁТЕСЛИМН,ОКРУГЛ;
    • Комбинация клавиш и для избавления от формул Ctrl+A, Ctrl+C; Специальная вставка значений;
    • Создание примечаний;
    • Создание ссылок на таблицу для скачивания;
    • Горячие клавиши Ctrl+C, Ctrl+V, Ctrl+Z;
    • Вставка примечаний;
    • Построение сводных таблиц и диаграмм.
  2. Работа с программами Linux на kodomo:
    • wordcount -wordsize (n/1) - подсчет длины последовательности нуклеотидов разной длины;
    • geecee - подсчет количества пар C/G;
    • cusp - подсчет частоты встречаемости кодонов, кодирующие одинаковые аминокислоты.
    • cusp - подсчет частоты встречаемости кодонов, кодирующих одну и ту же аминокислоту ;
    • cbcalc -s words-n -K - расчёт отношения наблюдаемой частоты последовательности длины n к ожидаемой (O/E).
  3. Работа с Python3:
    • - использование языка для написание программы подсчета длины генома.

3.РЕЗУЛЬТАТЫ

3.1 РАЗМЕР ГЕНОМА.

Размер генома Dehalococcoides mccartyi составляет 1388914 п.н. Для вычисления использовалась программа count_genome.fasta.py (2).

3.2 ТИПЫ ГЕНОВ

При анализе генома D. mccartyi было выявлено, что рассматриваемая бактериальная хромосома содержит 1438 генов, кодирующих белки, что составляет около 95,87 % всех генов, содержащихся в протеоме, тРНК кодируются примерно 3,13% генов, а рибосомальные и некоторые другие молекулы РНК кодируются 0,2% и по 0,07% генов соответственно.

Таблица 1: Численное и процентное содержание генов в протеоме D. mccartyi.
Molecule type Number of genes Ratio (%)
proteins 1438 95,87
pseudogenes 47 0,67
tRna 10 3,13
rRna 3 0,2
tmRNA 1 0,07
RNase_P_RNA 1 0,007

Выяснилось, что в геноме данной бактерии не содержатся гены, кодирующие SRP_RNA , ncRNA и antisense_RNA (3).

3.3 ТИПЫ НУКЛЕОТИДОВ

По ходу исследования генома на качественное и количественное соотношение по различным нуклеотидам нетипичные азотистые основания выявлены не были. Соотношения пар A/T и G/C находятся в рамках нормы и составляют попарную пропорцию 1:1 соответственно (4). По процентному содержанию каждый пурин занимает большую долю (в пределах 26%), чем каждый пиримидин (около 23%). Правило Чаргаффа соблюдается. Результаты представлены на Рис.1.

Рисунок 1. Процентное содержание нуклеотидов в протеоме D. mccarty. По горизонтали представлены типы нуклеотидов, по вертикали - содержание в геноме в процентах.

3.4 СООТНОШЕНИЕ AT/GC ПАР

Интересным аспектом для исследования также является количественное соотношение пар пуринов к пиримидинам. В геноме D. mccartyi пурины преобладают над пиримидинами. Этот факт неясен и интересен для изучения, так как прочность тройной связи между G/C больше, чем прочность двойной между A/T (5) . Результаты представлены на Рис.2.
Рисунок 2. Процентное содержание пар пуринов и пиримидинов в протеоме D. mccarty.

3.5. ЧАСТОТЫ КОДОНОВ, КОДИРУЮЩИХ АМИНОКИСЛОТЫ

Далее был проведен анализ генома на частоты кодонов, кодирующих одинаковые аминокислоты. Полученные данные были реструктурированы в сводную таблицу и выведены на диаграмму (Рис.3) . Информация о данных с наиболее и наименее часто используемыми кодонами также представлена в сводной таблице (6). По итогам было выявлено, что наибольшее число кодонов, 6 шт., имеют аминокислоты S, R и L. Далее с количество снизилось до 4 у V, T, P, G, и А. Кодирование одной аминокислоты двумя кодонами используется для 9 аминокислот и составляет основной процент от всего аминокислотного состава. Одним кодоном кодируется W и M (метионин). Для большинства бактерий старт кодоном синтеза белка бактерий - модифицированный метионин (N-формилметионин) [5]. Кодирование метионина только единственным триплетом возможно объясняется особенностью компактности генома большинства прокариот. Знаком “ * “ обозначены 3 стоп кодона: TAA, TAG, TGA.

Рисунок 3. Частоты встречаемости кодонов, кодирующих одни и те же аминокислоты. По оси абсцисс отложены типы аминокислот, по вертикали отложена частота встречаемости.

4. ЗАКЛЮЧЕНИЕ

Бактерия Dehalococcoides mccartyi представляет собой интересный объект для изучения, так как данный штамм может иметь широкое практическое применение для предотвращения загрязнений окружающей среды и предупреждения многих заболеваний человека. Дальнейшее изучение генома может показать новые стороны особенностей метаболизма D. mccartyi не использующий все известные науке типы метаболизма и ферментации.

СОПРОВОДИТЕЛЬННЫЕ МАТЕРИАЛЫ

  1. Ссылка на xlsx файл с рассчетами и результатами:
    • Ссылка
    • (1) Лист “genes” - полная информация о геноме бактерии;
    • (2) Лист “genome_size” - размер генома и скрипт для его вычисления;
    • (3) Лист “gene_per_types” - качественное содержание генов в геноме;
    • (4) Лист “ nucleotide_content” - качественное содержание нуклеотидов в геноме;
    • (5) Лист “Complementary_pair_frequencies” - соотношение пар A/T к G/C в геноме
    • (6) Лист “amino_acid_encoding”- сводная таблица по количественному содержанию кодонов, кодирующих одни аминокислоты.
  2. Адрес на файл с программой coun_genome.fasta.py:
    • (2.1) tychkovakatya@kodomo: ~/term1/block3/credits/count_genome.fasta.py

ЛИТЕРАТУРА И ИСТОЧНИКИ

  1. Benjamin K Amos, Kirsti M Ritalahti, Claribel Cruz-Garcia, Elizabeth Padilla-Crespo, Frank E Löffler “Oxygen effect on Dehalococcoides viability and biomarker quantification” Environ. Sci. Technol. 2008, 42, 15, 5718–5726;- [2] Manuel I. Villalobos Solis, Paul E. Abraham, Karuna ;
  2. Chourey, Cynthia M. Swift, Frank E. Löffler & Robert L. Hettich “Targeted detection of Dehalococcoides mccartyi microbial protein biomarkers as indicators of reductive dechlorination activity in contaminated groundwater” Scientific Reports 9, Article number: 10604 (2019);
  3. Краткие сведения о штамме D.mccartyi в Microbe wiki;
  4. База данных NCBI с изначальными данными о последовательности генома и feature_table бактерии D. mccartyi.