Изначально был создан единственный входной файл для NPG-explorer.Он содержит следующую информацию о выбранных бактериях: база данных, AC, штамм, хромосома, тип ДНК (кольцевая/линейная) и полное название штамма.
Далее с помощью приведенных ниже команд был построен пангеном и получены log-файлы.
npge -g npge.conf
npge Prepare &> log_prepare
npge Examine &> log_examine
npge MakePangenome &> log_make
npge PostProcessing &> log_post
* Параметры MakePangenome не изменялись
С помощью файла pangenome.info была составлена следующая таблица:
число блоков (s-blocks) | 1 |
размер нуклеотидного ядра как процент нуклеотидов в ядре от числа нуклеотидов во всех геномах | 0% (при подсчете вручную получилось 312/11404930=0,0027%) |
процент консервативных колонок в объединённом выравнивании s-блоков | 90,38% |
блок | описание | количество таких блоков в пангеноме |
полустабильные блоки (h-блоки/Partial blocks) | по одному фрагменту из двух или более геномов, но не из всех геномов | 49 |
Уникальные последовательности (u-блоки) Unique | одна последовательность из одного генома, не имеющая ни одной похожей последовательности во входных данных | 653 |
Блоки с повторами (r-блоки) | включают более одного фрагмента хотя бы из одного генома | 340 |
Из таблицы видно, что большую часть (более 90%) пангенома составляют уникальные последовательности, а на стабильное ядро приходится менее 1 % нуклеотидов. Это свидетельсвует о не очень хорошем полученном выравнивании.
Данные из файла pangenome.bi были перенесены в Excel file для удобства поиска делеций. Результат поиска приведен в таблице ниже:
геном | блок, подтверждающий делецию | длина делеции | названия генов |
ZC4 | h2x174 | 174 | 50S ribosomal protein L2 |
CO2 | h2x170 | 170 | chaperonin GroEL |
TKL69 | h2x120 | 120 | ATP synthase subunit beta |
С помощью blast были получены следующие попарные выравнивания геномов:
Из полученных карт локального сходства (Dot Plot) видно, что в каждом из трех штаммов происходили инверсии, наиболее крупные отмечены красным маркером.
В программе Mega было построено следующее филогенетическое дерево методом Neighbor-Joining.
Кажется, полученное дерево подтверждает больший процент совпадения по всей карте в геномах C05 и TKL69 (рис 1) по сравнению с другими выравниваниями(рис 2 и 3).