Выравнивание было сделано для семейства белков с ID PF06321. Для анализа выбраны белки с PDB ID: 3LIU, 4JG5, 3UP6. В PDB произвел парное выравнивание 3LIU с 3UP6, затем 3LIU с 4JG5
MUSCLE (MUltiple Sequence Comparison by Log-Expectation) - это программа, позволяющая выравнивать белковые и нуклеотидные последовательности. Она осуществляет это в три этапа: предварительный прогрессивный (Draft Progressive), улучшенный прогрессивный (Improved Progressive) и уточнение (Refinement). На первом этапе алгоритм создает множественное выравнивание, пренебрегая точностью в пользу скорости. Сначала просчитывается k-мерная дистанция для каждой пары выравниваний для создания матрицы дистанций, которая затем переводится в бинарное дерево. Для создания профилей каждого "листа" этого дерева в каждом узле осуществляется попарное выравнивание. На втором этапе получается более оптимальное дерево с помощью дистанции Кимуры и последующего повторения действий первого этапа. На последнем этапе происходит деление полученного дерева на суб деревья, которые заново выравниваются и длятся до тех пор, пока наилучшие множественные выравнивания не будут получены.