Практикум 12. Множественное выравнивание последовательностей белков
Задание 1
Были взяты белки с мнемоникой Leuc из практикума 9:LEUC_YEAST;LEUC_ARATH;LEUC_MUCCL
LEUC1_SALTY;LEUC_AZOSB;LEUC_ECOLI;LEUC_BACSU
. Они были выравнены с помощью программ:
Muscle
Mafft
Пара выравниваний были сравнены с помощью программ VerAlign и Лизы Плешко
Сравнение Maff и Muscle с помощью программ VerAlign
Получаем:
SP score: 0.97
CS score: 0.93
Cсылка на выравнивание
Используя команду , написанную Лизой Плешко(compare_alig.py) запускаем: python compare_alig.py -a1 ~/pr12/1.fasta -a2 ~/pr12/2.fasta -o out.csv
Получаем:
Доля одинаково выравненных позиций в первом выравнивании:
0.54%
Доля одинаково выравненных позиций во втором выравнивании:
0.55%
Cсылка на выравнивание
Задание 2
Были выбраны следующие белки из семейства ADH_zinc_N (PF00107)
:
1.A0A0H2V9Q5_ECOL6(4ILK)
2.A0A1C7D195_CATRO(5H83)
3.A0A0H2ZRI0_STRP2 (5YLN)
Выравнивание было сделано с помощью инструмента align в Pymol.Результаты показаны на рис.1. Белки хорошо выровнены.
Рис 1. Выравниение по совмещению структур в Pymol:4ILK-голубой,5H83-желтый ,5YLN-розовый
Выравнивание , используя программу Muscle соответствует выравниванию в PyMOL, потому что мы видим крупные совпадающие блоки
Ссылка на выравнивание
Задание 3
MAFFT (для множественного выравнивания с использованием быстрого преобразования Фурье) — это программа, используемая для создания множественного выравнивания аминокислотных или нуклеотидных последовательностей.
Алгоритм MAFFT работает, следуя этим 5 шагам:
1.Pairwise Alignment: этот шаг используется для определения областей, похожих между введенными последовательностями.
2.Distance Matrix: с помощью рассчитанных парных выравниваний выполняется расчет матрицы расстояний для оценки различий между выравниваниями на основе их оценок выравнивания.
3.Guide Tree: с использованием матрицы расстояний строится направляющее дерево, в котором имеется иерархическое представление кластеров (каждый узел является кластером), а включенные ветви представляют собой расстояние между кластерами.
4.Progressive Alignment: с помощью дерева направляющих прогрессивное выравнивание выполняется от листьев к корню. Алгоритм использует введенные последовательности и выравнивает дочерние узлы, чтобы вычислить согласованное выравнивание для родительского узла. Этот шаг выполняется до тех пор, пока не будет пройдено все дерево, что приведет к окончательному множественному выравниванию последовательностей.
5.Iterative Alignment: на этапе итеративного уточнения весь процесс повторяется с корректировкой положения промежутков и вставок для повышения точности выравнивания.