Описание программы сравнения множественных выравниваний

Python 3.10-скрипт для сравнительного анализа двух выравниваний написан и протестирован Георгием Малаховым в соавторстве со мной, Матвеем Киселевым и Артёмом Тюкаевым. Я участвовал в разработке идеи алгоритма, и в его тестировании.

Ссылка на скрипт на Github

Как входные данные программа принимает пути для двух выравнивний, каждое в формате .fasta или .fa

Я участвовал в разработке идеи алгоритма, и в его тестировании.

Тестирование этого скрипта осуществлено на нескольких парах выравниваний. В каждой выравнивания сделаны с применением различных алгоритмов. Приведу пример одного такого теста.

Выровнены последовательности 5 Gag и Gag-Pro полипротеинов вирусов. Сначала они были выровнены алгоритмом Mafft, потом алгоритмом Muscle. Скачать проект Jalview

Output скрипта для нашей пары выравниваний, первым в скрипт я подал выравниавние с помощью Muscle, вторым с помощью Mafft. Выраниванию Muscle соответствует первая колонка, Mafft- вторая

F1-L1     F2-L2

1-8         1-8

71-112    64-105

Согласно нашему алгоритму, 1-8 колонки выравниваний совпадают, а 71-112 колонки Muscle совпадают с 64-105 колонками Mafft. Это так, см. скриншот.

ХИХИХИХА ХИХИХИХА

Рис.1 Два выравнивания в Jalview. Окраска по проценту сходства