Подготовка к заданию

Выбор штаммов и создание необходимых файлов

Для разбора были выбраны три штамма археи Methanococcus maripaludis с собранными геномами: С5, OS7 и KA1.

Methanococcus maripaludis является модельной архей и используется в основном для изучения биосинтеза метана, имеет несколько хорошо изученных стабильных штаммов с аннотированными геномами, представленными одной кольцевой хромосомой. Некоторые штаммы содержат плазмиду, однако файл genomes.tsv был создан так, что она не входит в инпут.

Основные результаты работы программы:

nj-global-tree.tre features.bs mutations.tsv consensuses.fasta pangenome.info pangenome.bs pangenome.bi

Стабильное ядро нуклеотидного пангенома

Результаты взяты из pangenome.info

Число S-блоков: 601

Процент от общего числа: 73.07%

Процент консервативных колонок в объединённом выравнивании S-блоков: 89.3459%

Анализ филогенетического древа

При помощи программы MEGA из файла nj-global-tree.tre было построено графическое филогенетическое древо, которое указывает, что штаммы С5 и КА1 являются более генетически близкими.

Программа строит его согласно анализу стабильного ядра из S-блоков, однако общую картину распределения она не выдает. При помощи анализа файла с блоками в Excel было уточнено распределение блоков по геномам и их объем. После чего отображено графически для более удобного изучения:

Насколько мы можем видеть, значительной корелляции с программно построенным не наблюдается. Наоборот, мы можем видеть, что общих блоков у штаммов OS7 и KA1 значительно больше чем общих у KA1 и CP5, не смотря на то, что в программно построенном древе KA1 и CP5 объеденены в одну подветвь. Также можно заметить, что CP5 имеет больше уникальных блоков, чем OS7 и KA1. Эти факты позволяют сделать предварительный вывод, что дерево, построенное при помощи инструментария NPG-explorer является неверным. Мое предположение, что OS7 и KA1 являются более близкими штаммами, в то время как CP5 должен быть вынесен в отдельную ветвь.