Практикум 12. Множественное выравнивание последовательностей белков

Задание 1

Были взяты белки с мнемоникой Leuc из практикума 9:LEUC_YEAST;LEUC_ARATH;LEUC_MUCCL LEUC1_SALTY;LEUC_AZOSB;LEUC_ECOLI;LEUC_BACSU . Они были выравнены с помощью программ:

Muscle

Mafft

Пара выравниваний были сравнены с помощью программ VerAlign и Лизы Плешко

  • Сравнение Maff и Muscle с помощью программ VerAlign
  • Получаем:

    SP score: 0.97
    CS score: 0.93

    Cсылка на выравнивание

  • Используя команду , написанную Лизой Плешко(compare_alig.py) запускаем: python compare_alig.py -a1 ~/pr12/1.fasta -a2 ~/pr12/2.fasta -o out.csv
  • Получаем:

    Доля одинаково выравненных позиций в первом выравнивании: 0.54%
    Доля одинаково выравненных позиций во втором выравнивании: 0.55%

    Cсылка на выравнивание

    Задание 2

    Были выбраны следующие белки из семейства ADH_zinc_N (PF00107) :

    1.A0A0H2V9Q5_ECOL6(4ILK)

    2.A0A1C7D195_CATRO(5H83)

    3.A0A0H2ZRI0_STRP2 (5YLN)

    Выравнивание было сделано с помощью инструмента align в Pymol.Результаты показаны на рис.1. Белки хорошо выровнены.

    Фотография 1

    Рис 1. Выравниение по совмещению структур в Pymol:4ILK-голубой,5H83-желтый ,5YLN-розовый

    Выравнивание , используя программу Muscle соответствует выравниванию в PyMOL, потому что мы видим крупные совпадающие блоки

    Ссылка на выравнивание

    Задание 3

    MAFFT (для множественного выравнивания с использованием быстрого преобразования Фурье) — это программа, используемая для создания множественного выравнивания аминокислотных или нуклеотидных последовательностей. Алгоритм MAFFT работает, следуя этим 5 шагам:

  • 1.Pairwise Alignment: этот шаг используется для определения областей, похожих между введенными последовательностями.
  • 2.Distance Matrix: с помощью рассчитанных парных выравниваний выполняется расчет матрицы расстояний для оценки различий между выравниваниями на основе их оценок выравнивания.
  • 3.Guide Tree: с использованием матрицы расстояний строится направляющее дерево, в котором имеется иерархическое представление кластеров (каждый узел является кластером), а включенные ветви представляют собой расстояние между кластерами.
  • 4.Progressive Alignment: с помощью дерева направляющих прогрессивное выравнивание выполняется от листьев к корню. Алгоритм использует введенные последовательности и выравнивает дочерние узлы, чтобы вычислить согласованное выравнивание для родительского узла. Этот шаг выполняется до тех пор, пока не будет пройдено все дерево, что приведет к окончательному множественному выравниванию последовательностей.
  • 5.Iterative Alignment: на этапе итеративного уточнения весь процесс повторяется с корректировкой положения промежутков и вставок для повышения точности выравнивания.