Описание программы сравнения множественных выравниваний
Python 3.10-скрипт для сравнительного анализа двух выравниваний написан и протестирован Георгием Малаховым в соавторстве со мной, Матвеем Киселевым и Артёмом Тюкаевым. Я участвовал в разработке идеи алгоритма, и в его тестировании.
Как входные данные программа принимает пути для двух выравнивний, каждое в формате .fasta или .fa
Я участвовал в разработке идеи алгоритма, и в его тестировании.
Тестирование этого скрипта осуществлено на нескольких парах выравниваний. В каждой выравнивания сделаны с применением различных алгоритмов. Приведу пример одного такого теста.
Выровнены последовательности 5 Gag и Gag-Pro полипротеинов вирусов. Сначала они были выровнены алгоритмом Mafft, потом алгоритмом Muscle. Скачать проект Jalview
Output скрипта для нашей пары выравниваний, первым в скрипт я подал выравниавние с помощью Muscle, вторым с помощью Mafft. Выраниванию Muscle соответствует первая колонка, Mafft- вторая
F1-L1     F2-L2
1-8         1-8
71-112    64-105
Согласно нашему алгоритму, 1-8 колонки выравниваний совпадают, а 71-112 колонки Muscle совпадают с 64-105 колонками Mafft. Это так, см. скриншот.