Описание эволюционных событий в геномах 4 штаммов сибиреязвенных бацилл

Информация о пангеноме

Для составления пангенома я взял следующие штаммы бактерии Bacillus anthracis:
- FDAARGOS_702 (AC CP054800.1)
- FDAARGOS_703 (AC CP054797.1)
- FDAARGOS_696 (AC CP050971.1)
- FDAARGOS_694 (AC CP050970.1)

Ссылки на лог-файлы для программ npge (тех, для которых было что-то информативное):
- Prepare
- MakePangenome

Количество S-блоков: 225; процент нуклеотидов в ядре от числа нуклеотидов во всех геномах: 95,6%; идентичность среди S-блоков 99,9951% (как-то очень уж высоко получилось)

Несостыковки в аннотациях генов

В S-блоке s4x3829 с идентичностью 100% участок 279-2017 обозначен в разных штаммах по-разному:
- в штаммах 694 и 696 - как "N-acetylmuramoyl-L-alanine amidase" (по-видимому, белок, разрезающий амидные связи с аланином в протеогликане клеточной стенки)
- в штаммах 702 и 703 - как "S-layer homology domain-containing protein" (не совсем понял эту конструкцию, кажется, белок, содержащий домен, характерный для белков S-слоя

Конечно, S-слой приближен к клеточной стенке, однако он состоит из одинаковых белков со структурной функцией, и кажется маловероятным, что в нём окажется фермент, пусть и из клеточной стенки

В S-блоке s4x1442 с идентичностью 100% участок 664-1206 обозначен:
-у штаммов 694, 696, 703 как "tyrosine-type recombinase/integrase"
- у штамма 702 как "site-specific integrase"

Более того, у штаммов 694, 696 и 703 в позициях 955-957 аннотирован стоп-кодон, а в позициях 985-987 - следующий старт-кодон (начинающий ген с таким же названием), а у штамма 702 эти кодоны никак не обозначены

Удивительное сходство геномов

Я пытался найти адекватные u- либо h-блоки (не состоящие полностью из N), и обнаружил только один - u1x336 в штамме 694.

Никаких генов на данном участке не аннотировано, более того, поиск blastX с дефолтными настройками также не дал ни одного результата. В остальном геномы очень схожи, и содержание разных генов в них отличается только числом копий (r-блоки)

Во всех штаммах мной были обнаружены гены вирулентности (поиск по ключевым словам "toxin", "capsule", "antigen", из чего можно сделать вывод, что все 4 штамма являются патогенными

К сожалению, никаких интересных эволюционных событий, отличающих штаммы, мне найти не удалось. Единственное, что различается между ними - копийность некоторых участков генома (и, стало быть, каких-то генов)