Выравнивание геномов


Подготовительный этап

Сначала было выбранно 4 штамма бактерий вида Salmonella enterica, содержащих одну хромосому, и был создан входной файл для NPG-explorer.

Далее, следуя инструкциям, был построен НПГ, stdout и stderr каждой команды были выведены в отдельные log-файлы: npge -g npge.conf
npge Prepare (prepare.log)
npge Examine (examine.log)
npge MakePangenome (make_pangenome.log")
npge PostProcessing (post.log)

При запуске npge MakePangenome была учтена рекомендация: MIN_IDENTITY: 0.887, WORKERS: 1


Полезные файлы с информацией:
blocks.gbi - Список глобальных блоков
mut.tsv - Информация о мутациях
features.bs - Описание всех генов
fragments.tsv - Координаты блоков
pangenome.info - Сводная информация про все типы блоков
pangenome.bi - Информация о фрагментах генов, входящих в разные блоки
fragments.tsv - Координаты всех блоков

Стабильное ядро пангенома


Число S-блоков: 310
Размер ядра относительно всех геномов: 87.33%
Процент консервативных колонок: 98.6%

Самые крупные делеции для штаммов

Блок h3x28562 (длина блока 28562), этот блок отсутсвует у штамма NCTC (у этого штамма в целом встречается больше всего делеций. Скорее всего он эволюциононо далек от остальных, возможно увидим это по дереву.

Блок h3x2966 (длина 2966), отсутствует у штамма АТСС (самая большая делеция для этого штамма).

Блок h2x786 (длина 786), его нет у двух штаммов: FDAARGOS и LT2. Интересно, что если у одного из этих двух штаммов есть какая-то делеция, то у второго она тоже есть. Это может говорить о их родстве (увидим по дереву).


Перестановка синтений


Перестановка глобального блока произошла у штамма NCTC, который, кстати, предположительно эволюционно далек от остальных. Как видно на картинке, блок g4x1264 переместился, он стоит правее блока g4x806705 в отличие от остальных штаммов, для которых он стоит левее.


Дерево


Все высказанные ранее догадки подтвердились: штаммы FDAARGOS и LT2 относятся к одной эволюционной ветви (а значит более близки друг к другу), и также дерево показало, что 2 других штамма (NCTC и ATCC) входят в другую родственную ветвь.