Практикум 13
Для этого были выбраны 17 последовательностей белков бета тубулина из разных организмов. Были использованы такие алгоритмы множественного выравнивания как MAFFT, Clustal, Muscle. В качестве референсного выравнивания я взял выравнивание, выполненное алгоритмом MAFFT
Результаты обоих сравнений достаточно схожи, совпадение MAFFT c Muscle составило 94.16 %, совпадение MAFFT с Clustal составило 93.72 %
Хоть и незначительно, но большее сходство с MAFFT на данном примере показывает алгоритм Muscle. Причём что у выравнивания Muscle, что у выравнивания Clustal первые 38 столбцов совпадают с выравниванием MAFFT, незначительные расхождения появляются лишь после
| Программы | Совпадающие блоки |
| MAFFT и Muscle |
1-38=1-38 45-441=45-441 |
| MAFFT и Clustal |
1-1=38-38 41=41 43=43 47-439=47-439 |
Для выравниваний были выбраны белки 1HXC, 1N22, 2ONG из семейства PF03936 Terpene synthase family, metal binding domain.
Процент совпадающих столбцов для первого выравнивания: 73.68 %
Процент совпадающих столбцов для второго выравнивания: 73.15 %
Из рисунка 1 можно видеть, что структуры А-цепей всех 3 белков практически полностью совпадают, при взгляде на выравнивание последовательностей не получится увидеть, что в выравнивании присутствует множество консервативных участков, но зато можно заметить, что в столбцах стоят обычно аминокислоты с похожими свойствами, что, несомненно, как раз и имеет значение для формирования похожих структур. В обоих выравниваниях имеются почти 75% совпавших столбцов и большое количество протяжённых совпадающих блоков, многие из которых (но далеко не все) соответствуют альфа-спиралям. Можно сделать вывод, что хоть у выравниваний имеется больше четверти не совпавших столбцов, оба метода справляются с нахождением основных консервативных участков, которые есть во всех выравниваемых белках и необходимы для формирования правильной структуры.
| Способы выравнивания | Совпадающие блоки |
| Сравнение выравнивания по совмещению структур и выравнивания MAFFT |
1-13=1-13 27-43=25-41 51-88=49-86 91-96=89-94 99-128=97-126 133-177=131-175 182-212=180-210 215-277=213-275 282-398=281-397 497-526=503-532 534-534=539-539 536-550=541-555 |
Рис. 13-1. Совмещение 3 структур.
Muscle — алгоритм множественного выравнивания белковых и нуклеотидных последовательностей, свою работу он выполняет в 3 этапа.
Этап 1:
На первом этапе алгоритм производит множественное выравнивание, отдавая предпочтение скорости, а не точности. С помощью алгоритма UPGMA создаётся дерево. На основе этого дерева строится прогрессивное выравнивание.
Этап 2:
На этом этапе основное внимание уделяется получению более оптимального дерева с использованием множественного выравнивания последовательностей, полученного на первом этапе. С помощью UPGMA строится второе дерево. Прогрессивное выравнивание выполняется для получения множественного выравнивания последовательностей, как на первом этапе, но оптимизируется путём вычисления выравниваний только в поддеревьях, порядок ветвления которых изменился по сравнению с первым двоичным деревом, что обеспечивает более точное выравнивание.
Этап 3:
Происходит дальнейшее уточнение. На этом заключительном этапе из второго дерева выбирается ребро(граница), при этом ребра посещаются по мере уменьшения расстояния от корня. Выбранное ребро удаляется, разделяя дерево на два поддерева. Затем для каждого поддерева вычисляется профиль множественного выравнивания. Новое множественное выравнивание последовательностей создаётся путём повторного выравнивания профилей поддеревьев. Если оценка SP улучшается, новое выравнивание сохраняется, в противном случае оно отбрасывается.