КРАТКИЙ ОБЗОР
БИОИНФОРМАТИКА
Обзор генома и протеома бактерии Dehalococcoides mccartyi
Тычкова Екатерина
Факультет биоинженерии и биоинформатики, Московский государственный университет имени М. В. Ломоносова, Ленинские горы д. 1 стр. 73, 119234, Москва, Россия
14 декабря 2020 года
РЕЗЮМЕ
Данная работа представляет собой анализ протеома и генома, общих биологических особенностей бактерии Dehalococcoides mccartyi (D. mccartyi). В процессе выполнения работы мною было установлено число генов, кодирующих белки, транспортные, рибосомальные и другие типы РНК, классы нуклеотидов и их различное соотношение, а также исследование аминокислотного состава протеома.
Ключевые слова: Dehalococcoides mccartyi, органо-галогенидное дыхание, геном.
1.ВВЕДЕНИЕ
D. mccartyi - бактерии рода Dehalococcoidia, способны к облигатному органо-галогенидному дыханию и не используют ферментацию и другие известные механизмы метаболизма [3]. Субстратом являются разнообразные органические соединения, такие как полихлорированные бифенилы или дибензо-п-диоксины, хлорированные эфины, включая перхлорэтен (PCE) и трихлорэтен (TCE) [1,2]. Данные вещества входят в список стойких загрязнителей окружающей среды и канцерогенов [2]. Органогалогенидная регенерирующая способность штамма Dehalococcoides mccartyi представляет собой практическую ценность для биовосстановления подземных водоносных горизонтов, загрязненных подобными промышленными растворителями и, следовательно, сокращения риска возникновения рака [2].
2.МАТЕРИАЛЫ И МЕТОДЫ
Работа проводилась с геномом бактерии, взятым из базы данных NSBI [4]. Дальнейшая работа проводилась с использованием следующих навыков:
-
Работа с Google Docs and Tables:
- Импортирование текстовых файлов;
- Применение функций: “Фильтр”;
- Сортировка данных по значению, перемещение столбцов;
- Редактирование формата таблицы;
- Использование спец символов и формул и функций: $,ПОИСКПОЗ, ВПР, СЧЁТЕСЛИ и СЧЁТЕСЛИМН,ОКРУГЛ;
- Комбинация клавиш и для избавления от формул Ctrl+A, Ctrl+C; Специальная вставка значений;
- Создание примечаний;
- Создание ссылок на таблицу для скачивания;
- Горячие клавиши Ctrl+C, Ctrl+V, Ctrl+Z;
- Вставка примечаний;
- Построение сводных таблиц и диаграмм.
-
Работа с программами Linux на kodomo:
- wordcount -wordsize (n/1) - подсчет длины последовательности нуклеотидов разной длины;
- geecee - подсчет количества пар C/G;
- cusp - подсчет частоты встречаемости кодонов, кодирующие одинаковые аминокислоты.
- cusp - подсчет частоты встречаемости кодонов, кодирующих одну и ту же аминокислоту ;
- cbcalc -s words-n -K - расчёт отношения наблюдаемой частоты последовательности длины n к ожидаемой (O/E).
-
Работа с Python3:
- - использование языка для написание программы подсчета длины генома.
3.РЕЗУЛЬТАТЫ
3.1 РАЗМЕР ГЕНОМА.
Размер генома Dehalococcoides mccartyi составляет 1388914 п.н. Для вычисления использовалась программа count_genome.fasta.py (2).
3.2 ТИПЫ ГЕНОВ
При анализе генома D. mccartyi было выявлено, что рассматриваемая бактериальная хромосома содержит 1438 генов, кодирующих белки, что составляет около 95,87 % всех генов, содержащихся в протеоме, тРНК кодируются примерно 3,13% генов, а рибосомальные и некоторые другие молекулы РНК кодируются 0,2% и по 0,07% генов соответственно.
Таблица 1: Численное и процентное содержание генов в протеоме D. mccartyi. | ||
Molecule type | Number of genes | Ratio (%) |
---|---|---|
proteins | 1438 | 95,87 |
pseudogenes | 47 | 0,67 |
tRna | 10 | 3,13 |
rRna | 3 | 0,2 |
tmRNA | 1 | 0,07 |
RNase_P_RNA | 1 | 0,007 |
Выяснилось, что в геноме данной бактерии не содержатся гены, кодирующие SRP_RNA , ncRNA и antisense_RNA (3).
3.3 ТИПЫ НУКЛЕОТИДОВ
По ходу исследования генома на качественное и количественное соотношение по различным нуклеотидам нетипичные азотистые основания выявлены не были. Соотношения пар A/T и G/C находятся в рамках нормы и составляют попарную пропорцию 1:1 соответственно (4). По процентному содержанию каждый пурин занимает большую долю (в пределах 26%), чем каждый пиримидин (около 23%). Правило Чаргаффа соблюдается. Результаты представлены на Рис.1.
![](./img/image1.png)
3.4 СООТНОШЕНИЕ AT/GC ПАР
![](./img/image2.png)
3.5. ЧАСТОТЫ КОДОНОВ, КОДИРУЮЩИХ АМИНОКИСЛОТЫ
![](./img/image3.png)
4. ЗАКЛЮЧЕНИЕ
Бактерия Dehalococcoides mccartyi представляет собой интересный объект для изучения, так как данный штамм может иметь широкое практическое применение для предотвращения загрязнений окружающей среды и предупреждения многих заболеваний человека. Дальнейшее изучение генома может показать новые стороны особенностей метаболизма D. mccartyi не использующий все известные науке типы метаболизма и ферментации.
СОПРОВОДИТЕЛЬННЫЕ МАТЕРИАЛЫ
-
Ссылка на xlsx файл с рассчетами и результатами:
- Ссылка
- (1) Лист “genes” - полная информация о геноме бактерии;
- (2) Лист “genome_size” - размер генома и скрипт для его вычисления;
- (3) Лист “gene_per_types” - качественное содержание генов в геноме;
- (4) Лист “ nucleotide_content” - качественное содержание нуклеотидов в геноме;
- (5) Лист “Complementary_pair_frequencies” - соотношение пар A/T к G/C в геноме
- (6) Лист “amino_acid_encoding”- сводная таблица по количественному содержанию кодонов, кодирующих одни аминокислоты.
-
Адрес на файл с программой coun_genome.fasta.py:
- (2.1) tychkovakatya@kodomo: ~/term1/block3/credits/count_genome.fasta.py
ЛИТЕРАТУРА И ИСТОЧНИКИ
- Benjamin K Amos, Kirsti M Ritalahti, Claribel Cruz-Garcia, Elizabeth Padilla-Crespo, Frank E Löffler “Oxygen effect on Dehalococcoides viability and biomarker quantification” Environ. Sci. Technol. 2008, 42, 15, 5718–5726;- [2] Manuel I. Villalobos Solis, Paul E. Abraham, Karuna ;
- Chourey, Cynthia M. Swift, Frank E. Löffler & Robert L. Hettich “Targeted detection of Dehalococcoides mccartyi microbial protein biomarkers as indicators of reductive dechlorination activity in contaminated groundwater” Scientific Reports 9, Article number: 10604 (2019);
- Краткие сведения о штамме D.mccartyi в Microbe wiki;
- База данных NCBI с изначальными данными о последовательности генома и feature_table бактерии D. mccartyi.