Для построения карт локального сходства (Dot Plot) были выбраны последовательности хромосом (сборок на уровне complete genome) двух штаммов вида Lacticaseibacillus paracasei:
Поскольку длина хромосом различается не сильно, не ожидается наличия крупных инделей.
Поиск последовательностей проводился на сайте базы данных ENA с помощью запроса:
tax_tree(2759736) AND description="chromosome"
Ниже можно увидеть карты Dot Plot, построенные выравниванием двух последовательностей алгоритмами megablast и blastn, которые были запущены без изменения параметров по умолчанию. Результаты имеют заметные отличия, в первую очередь, это обилие повторов в геномах двух штаммов, которые смог выявить алгоритм blastn. Алгоритм megablast не уловил эти данные, поскольку он предназанчен для быстрого поиска почти идентичных последовательностей. Повторы на второй карте можно назвать шумом, поскольку они могут мешать интерпретации глобальных изменений геномов, но в то же время они позволяют говорить о гомологии данных последовательностей. На карте blastn хорошо видно никуда не выровнявшиеся участки (по Ох 900-950 kb, по Oy 2,5 mb).
Если говорить о результатах в целом (рис.3): за начало кольцевой хромосомы (плазмиды) были взяты разные точки п-тей, о чем говорит разрыв, отмеченный звездочкой. Наблюдается инверсия (выравнивается прямая и обратная цепь), о чем говорит ход диагонали из верхнего в нижний угол карты. Не наблюдается транслокаций, все линии более-менее идут друг за другом. На карте видно множество небольших инделей, наиболее крупные из которых отмечены синим цветом, если вероятно произошла вставка в CP029686 / делеция в CP080336, или зеленым цветом, если наоборот вставка в CP080336 / делеция в CP029686. Также нет сильно неконсервативных участков, которые нельзя было бы приписать к инделям.
На мой взгляд, хромосомы у данных штаммов различаются не сильно, если судить по картам локального сходства (то есть очевидна гомология).