КРАТКИЙ ОБЗОР
БИОИНФОРМАТИКА
Обзор генома и протеома бактерии Dehalococcoides mccartyi
Тычкова Екатерина
Факультет биоинженерии и биоинформатики, Московский государственный университет имени М. В. Ломоносова, Ленинские горы д. 1 стр. 73, 119234, Москва, Россия
14 декабря 2020 года
РЕЗЮМЕ
Данная работа представляет собой анализ протеома и генома, общих биологических особенностей бактерии Dehalococcoides mccartyi (D. mccartyi). В процессе выполнения работы мною было установлено число генов, кодирующих белки, транспортные, рибосомальные и другие типы РНК, классы нуклеотидов и их различное соотношение, а также исследование аминокислотного состава протеома.
Ключевые слова: Dehalococcoides mccartyi, органо-галогенидное дыхание, геном.
1.ВВЕДЕНИЕ
D. mccartyi - бактерии рода Dehalococcoidia, способны к облигатному органо-галогенидному дыханию и не используют ферментацию и другие известные механизмы метаболизма [3]. Субстратом являются разнообразные органические соединения, такие как полихлорированные бифенилы или дибензо-п-диоксины, хлорированные эфины, включая перхлорэтен (PCE) и трихлорэтен (TCE) [1,2]. Данные вещества входят в список стойких загрязнителей окружающей среды и канцерогенов [2]. Органогалогенидная регенерирующая способность штамма Dehalococcoides mccartyi представляет собой практическую ценность для биовосстановления подземных водоносных горизонтов, загрязненных подобными промышленными растворителями и, следовательно, сокращения риска возникновения рака [2].
2.МАТЕРИАЛЫ И МЕТОДЫ
Работа проводилась с геномом бактерии, взятым из базы данных NSBI [4]. Дальнейшая работа проводилась с использованием следующих навыков:
-
Работа с Google Docs and Tables:
- Импортирование текстовых файлов;
- Применение функций: “Фильтр”;
- Сортировка данных по значению, перемещение столбцов;
- Редактирование формата таблицы;
- Использование спец символов и формул и функций: $,ПОИСКПОЗ, ВПР, СЧЁТЕСЛИ и СЧЁТЕСЛИМН,ОКРУГЛ;
- Комбинация клавиш и для избавления от формул Ctrl+A, Ctrl+C; Специальная вставка значений;
- Создание примечаний;
- Создание ссылок на таблицу для скачивания;
- Горячие клавиши Ctrl+C, Ctrl+V, Ctrl+Z;
- Вставка примечаний;
- Построение сводных таблиц и диаграмм.
-
Работа с программами Linux на kodomo:
- wordcount -wordsize (n/1) - подсчет длины последовательности нуклеотидов разной длины;
- geecee - подсчет количества пар C/G;
- cusp - подсчет частоты встречаемости кодонов, кодирующие одинаковые аминокислоты.
- cusp - подсчет частоты встречаемости кодонов, кодирующих одну и ту же аминокислоту ;
- cbcalc -s words-n -K - расчёт отношения наблюдаемой частоты последовательности длины n к ожидаемой (O/E).
-
Работа с Python3:
- - использование языка для написание программы подсчета длины генома.
3.РЕЗУЛЬТАТЫ
3.1 РАЗМЕР ГЕНОМА.
Размер генома Dehalococcoides mccartyi составляет 1388914 п.н. Для вычисления использовалась программа count_genome.fasta.py (2).
3.2 ТИПЫ ГЕНОВ
При анализе генома D. mccartyi было выявлено, что рассматриваемая бактериальная хромосома содержит 1438 генов, кодирующих белки, что составляет около 95,87 % всех генов, содержащихся в протеоме, тРНК кодируются примерно 3,13% генов, а рибосомальные и некоторые другие молекулы РНК кодируются 0,2% и по 0,07% генов соответственно.
Таблица 1: Численное и процентное содержание генов в протеоме D. mccartyi. | ||
Molecule type | Number of genes | Ratio (%) |
---|---|---|
proteins | 1438 | 95,87 |
pseudogenes | 47 | 0,67 |
tRna | 10 | 3,13 |
rRna | 3 | 0,2 |
tmRNA | 1 | 0,07 |
RNase_P_RNA | 1 | 0,007 |
Выяснилось, что в геноме данной бактерии не содержатся гены, кодирующие SRP_RNA , ncRNA и antisense_RNA (3).
3.3 ТИПЫ НУКЛЕОТИДОВ
По ходу исследования генома на качественное и количественное соотношение по различным нуклеотидам нетипичные азотистые основания выявлены не были. Соотношения пар A/T и G/C находятся в рамках нормы и составляют попарную пропорцию 1:1 соответственно (4). По процентному содержанию каждый пурин занимает большую долю (в пределах 26%), чем каждый пиримидин (около 23%). Правило Чаргаффа соблюдается. Результаты представлены на Рис.1.
3.4 СООТНОШЕНИЕ AT/GC ПАР
3.5. ЧАСТОТЫ КОДОНОВ, КОДИРУЮЩИХ АМИНОКИСЛОТЫ
4. ЗАКЛЮЧЕНИЕ
Бактерия Dehalococcoides mccartyi представляет собой интересный объект для изучения, так как данный штамм может иметь широкое практическое применение для предотвращения загрязнений окружающей среды и предупреждения многих заболеваний человека. Дальнейшее изучение генома может показать новые стороны особенностей метаболизма D. mccartyi не использующий все известные науке типы метаболизма и ферментации.
СОПРОВОДИТЕЛЬННЫЕ МАТЕРИАЛЫ
-
Ссылка на xlsx файл с рассчетами и результатами:
- Ссылка
- (1) Лист “genes” - полная информация о геноме бактерии;
- (2) Лист “genome_size” - размер генома и скрипт для его вычисления;
- (3) Лист “gene_per_types” - качественное содержание генов в геноме;
- (4) Лист “ nucleotide_content” - качественное содержание нуклеотидов в геноме;
- (5) Лист “Complementary_pair_frequencies” - соотношение пар A/T к G/C в геноме
- (6) Лист “amino_acid_encoding”- сводная таблица по количественному содержанию кодонов, кодирующих одни аминокислоты.
-
Адрес на файл с программой coun_genome.fasta.py:
- (2.1) tychkovakatya@kodomo: ~/term1/block3/credits/count_genome.fasta.py
ЛИТЕРАТУРА И ИСТОЧНИКИ
- Benjamin K Amos, Kirsti M Ritalahti, Claribel Cruz-Garcia, Elizabeth Padilla-Crespo, Frank E Löffler “Oxygen effect on Dehalococcoides viability and biomarker quantification” Environ. Sci. Technol. 2008, 42, 15, 5718–5726;- [2] Manuel I. Villalobos Solis, Paul E. Abraham, Karuna ;
- Chourey, Cynthia M. Swift, Frank E. Löffler & Robert L. Hettich “Targeted detection of Dehalococcoides mccartyi microbial protein biomarkers as indicators of reductive dechlorination activity in contaminated groundwater” Scientific Reports 9, Article number: 10604 (2019);
- Краткие сведения о штамме D.mccartyi в Microbe wiki;
- База данных NCBI с изначальными данными о последовательности генома и feature_table бактерии D. mccartyi.