Для множественного выравнивания я взял четыре генома небезысветной бактерии Yersinia pestis, принадлежащих штаммам FDAARGOS_601, El Dorado, Shasta и Dodson (CP033699.1, CP009785.1, CP009723.1, CP009844.1). Вся директория, в которой производилась работа с NPG-explorer, доступна в ~/term3/block2/credits под именем y_pestis_npge.
log-файл программы MakePangenome
log-файл программы PostProcessing
В блоке s4x20683 с позиции 18385 выравнивания блока проаннотирована последовательность, начинающаяся с ATG, в геноме FDAARGOS_601 как липопротеин. Однако в трёх других геномах идентичная последовательность проаннотирована как липопротеин, начиная со следующего кодона ATG с позиции 18454. Скорее всего, правильной является аннотация в тех рамках, в которых встречается в трех геномах, а не в одном. Участок в пределах 50-70 нуклеотидов перед вторым ATG богат AT-парами, что, возможно, можно проинтерпретировать как точку начала транскрипции. Тогда более вероятно, что старт-кодон трансляции будет находиться за ней.
Блок g4x67703 присутствует в геномах штаммов El Dorado и Shasta в позиции 61 общего выравнивания блоков, а в геномах Dodson и FDAARGOS_601 он находится в 55 и 69 позициях, соответственно. Насколько я понимаю, поменялось и направление блока.