Для разбора были выбраны три штамма археи Methanococcus maripaludis с собранными геномами: С5, OS7 и KA1.
Methanococcus maripaludis является модельной архей и используется в основном для изучения биосинтеза метана, имеет несколько хорошо изученных стабильных штаммов с аннотированными геномами, представленными одной кольцевой хромосомой. Некоторые штаммы содержат плазмиду, однако файл genomes.tsv был создан так, что она не входит в инпут.
Основные результаты работы программы:
nj-global-tree.tre | features.bs | mutations.tsv | consensuses.fasta | pangenome.info | pangenome.bs | pangenome.bi |
Результаты взяты из pangenome.info
Число S-блоков: 601
Процент от общего числа: 73.07%
Процент консервативных колонок в объединённом выравнивании S-блоков: 89.3459%
При помощи программы MEGA из файла nj-global-tree.tre было построено графическое филогенетическое древо, которое указывает, что штаммы С5 и КА1 являются более генетически близкими.
Программа строит его согласно анализу стабильного ядра из S-блоков, однако общую картину распределения она не выдает. При помощи анализа файла с блоками в Excel было уточнено распределение блоков по геномам и их объем. После чего отображено графически для более удобного изучения:
Насколько мы можем видеть, значительной корелляции с программно построенным не наблюдается. Наоборот, мы можем видеть, что общих блоков у штаммов OS7 и KA1 значительно больше чем общих у KA1 и CP5, не смотря на то, что в программно построенном древе KA1 и CP5 объеденены в одну подветвь. Также можно заметить, что CP5 имеет больше уникальных блоков, чем OS7 и KA1. Эти факты позволяют сделать предварительный вывод, что дерево, построенное при помощи инструментария NPG-explorer является неверным. Мое предположение, что OS7 и KA1 являются более близкими штаммами, в то время как CP5 должен быть вынесен в отдельную ветвь.