Выравнивание геномов

Описание крупных эволюционных событий, обнаруженных в геномах 3 штаммов Bacillaceae bacterium.

Построение нуклеотидного пангенома

Изначально был создан единственный входной файл для NPG-explorer.Он содержит следующую информацию о выбранных бактериях: база данных, AC, штамм, хромосома, тип ДНК (кольцевая/линейная) и полное название штамма.

Далее с помощью приведенных ниже команд был построен пангеном и получены log-файлы.

npge -g npge.conf

npge Prepare &> log_prepare

npge Examine &> log_examine

npge MakePangenome &> log_make

npge PostProcessing &> log_post

* Параметры MakePangenome не изменялись

log_prepare

log_examine

log_make

log_post

nj-global-tree.tre

features.bs

mut.tsv

consensuses.fasta

pangenome.info

pangenome.bs

pangenome.bi

Описание стабильного ядра нуклеотидного пангенома

С помощью файла pangenome.info была составлена следующая таблица:

Table 1. Стабильное ядро
число блоков (s-blocks) 1
размер нуклеотидного ядра как процент нуклеотидов в ядре от числа нуклеотидов во всех геномах 0% (при подсчете вручную получилось 312/11404930=0,0027%)
процент консервативных колонок в объединённом выравнивании s-блоков 90,38%

Исследование различных блоков

Table 2. h-, u- and r- blocks
блок описание количество таких блоков в пангеноме
полустабильные блоки (h-блоки/Partial blocks) по одному фрагменту из двух или более геномов, но не из всех геномов 49
Уникальные последовательности (u-блоки) Unique одна последовательность из одного генома, не имеющая ни одной похожей последовательности во входных данных 653
Блоки с повторами (r-блоки) включают более одного фрагмента хотя бы из одного генома 340

Из таблицы видно, что большую часть (более 90%) пангенома составляют уникальные последовательности, а на стабильное ядро приходится менее 1 % нуклеотидов. Это свидетельсвует о не очень хорошем полученном выравнивании.

Описание крупной делеции в каждом геноме

Данные из файла pangenome.bi были перенесены в Excel file для удобства поиска делеций. Результат поиска приведен в таблице ниже:

Table 3. Делеции
геном блок, подтверждающий делецию длина делеции названия генов
ZC4 h2x174 174 50S ribosomal protein L2
CO2 h2x170 170 chaperonin GroEL
TKL69 h2x120 120 ATP synthase subunit beta

Исследование попарных выравниваний и выявление инверсии

С помощью blast были получены следующие попарные выравнивания геномов:

Picture 1. выравнивание C05 и TKL69 штаммов
Picture 2. выравнивание C05 и ZC4 штаммов
Picture 3. выравнивание TKL69 и ZC4 штаммов

Из полученных карт локального сходства (Dot Plot) видно, что в каждом из трех штаммов происходили инверсии, наиболее крупные отмечены красным маркером.

Исследование процесса эволюции штаммов с пoмощью MEGA

В программе Mega было построено следующее филогенетическое дерево методом Neighbor-Joining.

Picture 4. Tree

Кажется, полученное дерево подтверждает больший процент совпадения по всей карте в геномах C05 и TKL69 (рис 1) по сравнению с другими выравниваниями(рис 2 и 3).