Алгоритмы и программы множественных выравниваний
Muscle:
Число последовательностей: 10
Длина первого выравнивания: 484
Длина второго выравнивания: 470
Процент совпадающих колонок в первом выравнивании: 22.73 %
Процент совпадающих колонок во втором выравнивании:: 23.4 %
Число совпадающих блоков: 13
Mafft:
Число последовательностей: 10
Длина первого выравнивания: 484
Длина второго выравнивания: 556
Процент совпадающих колонок в первом выравнивании: 5.99 %
Процент совпадающих колонок во втором выравнивании:: 5.22 %
Число совпадающих блоков: 6
ClustalO:
Число последовательностей: 10
Длина первого выравнивания: 484
Длина второго выравнивания: 430
Процент совпадающих колонок в первом выравнивании: 8.68 %
Процент совпадающих колонок во втором выравнивании:: 9.77 %
Число совпадающих блоков: 7
1ABR - CRYSTAL STRUCTURE OF ABRIN-A
1BR6 - RICIN A CHAIN (RECOMBINANT) COMPLEX WITH PTEROIC A
1HWN - EBULIN COMPLEXED WITH GALACTOSE, TRIGONAL CRYSTAL FORM
Параметры, характерные для выравнивания этих белков, представлены в таблице 1:Таблица 1. Результаты выравнивания белков 1ABR, 1BR6, 1HWN
Рисунок 1. Совмещение структур белков: желтым цветом окрашен белок 1ABR, синим - 1BR6, a зеленым - 1HWN
Выравнивание белков. Проект в Jalview. Попарное и множественные выравнивания
1. Черновое выравнивание
На этом первом этапе алгоритм производит многократное выравнивание, делая упор на скорость, а не на точность. Этот шаг начинается с вычисления k-мерного расстояния для каждой пары входных последовательностей, чтобы создать матрицу расстояний. Затем с учетом матрицы расстояний формируется бинарное дерево, на основе которого строится последовательное выравнивание, начиная с создания профилей для каждого листа дерева. Для каждого узла в дереве строится попарное выравнивание двух дочерних профилей, создавая новый профиль, который будет назначен этому узлу. Это продолжается до тех пор, пока не будет достигнуто многократное выравнивание всех входных последовательностей в корне дерева.2. Исправление
На этом этапе основное внимание уделяется получению более оптимального дерева путем вычисления расстояния для каждой пары входных последовательностей с использованием множественного выравнивания последовательностей, полученного на первом этапе, и созданию второй матрицы расстояний. Затем эта матрица расстояний группируется для получения второго бинарного дерева. Прогрессивное выравнивание выполняется для получения множественного выравнивания последовательностей, как на этапе 1, но оно оптимизируется только путем вычисления выравниваний в поддеревьях, порядок ветвления которых изменился по сравнению с первым бинарным деревом, что приводит к более точному выравниванию.3. Уточнение
На этом заключительном этапе из второго дерева выбирается ребро, расстояние от которого до корня уменьшается. Выбранное ребро удаляется, разделяя дерево на два поддерева. Затем для каждого поддерева вычисляется профиль множественного выравнивания. Новое выравнивание с несколькими последовательностями создается путем переориентации профилей поддеревьев. Если оценка улучшается, новое выравнивание сохраняется, в противном случае оно отменяется. Процесс удаления ребра и выравнивания повторяется до тех пор, пока не будет достигнуто сближение или пока не будет достигнут определенный пользователем предел.Рисунок 2. Алгоритм выравнивания Muscle