🌸Назад

Сравнения программ для множественного выравнивания

В Uniprot были выбраны 20 последовательностей инсулина. Они были выровненны программами: MAFFT, Muscle и Clustalo. В качестве рефенесного было выбрано выравнивание сделанное с помощью MAFFT.

Я воспользовалась программой для сравнения выравниваний, которую сделали мои однокурсники(сердечно благодарю их) 🌸Ссылочка

Результаты:

🌸MAFFT vs MUSCLE Comparison

Block Alignment_1 Alignment_2
11-571-57
265-7264-71
374-7473-73
476-7675-75
590-11989-118

🌸MAFFT vs Clustalo Comparison

Block Alignment_1 Alignment_2
16-186-18
221-5021-50
353-5653-56
466-7365-72
585-8584-84
688-11987-118

Из получнных данных можно сделать вывод, что выравнивание программой Muscle больше похоже на референсное, чем выравнивание программой Clustalo

  • Проект в Jalveiw: 🌸Файлик
  • Выравнивание 3D структур

    Для выравнивания были выбраны белки 1ATN, 1C0F, 1D4X. На выравнивании, полученном при совмещении пространственных структур есть консервативный участкок 162-171, пристуствуют консервативные колонки 297, 300, 329 и другие. В выравнивании, сделанном программой MAFFT гораздо больше консервативных столбцов и участков 114-123, 327-354, 367-382. Это все свидетельствует о том, что выравнивание сделанное программой более точно и на нем проще отследить гомологичность белков. При этом в обоих очень большое количество гэпов(особенно, для белка 1C0F, потому что он короче двух других), поэтому сложнее сказать о гомологии представленных белков.

    Совмещение трех пространственных структур
    Рисунок 1. Совмещение трех пространственных структур
  • Проект сравнения двух выравниваний в Jalveiw: 🌸Файлик
  • Описание программы MSA

    MAFFT (Multiple Alignment using Fast Fourier Transform) представляет собой высокоэффективный алгоритм для множественного выравнивания биологических последовательностей. Сначала программа применяет быстрое преобразование Фурье (FFT) для поиска схожих участков, затем строит матрицу сходства и направляющее дерево для определения порядка выравнивания. В конце выполняется итеративное уточнение выравнивания, где большое внимание уделяется обработке областей с низкой степенью консервативности. Для больших наборов данных используются оптимизации - частичное выравнивание и сжатие идентичных последовательностей. В расширенных режимах (E-INS-i, X-INS-i) учитываются структурные особенности. MAFFT демонстрирует особую эффективность при выравнивании больших наборов данных, но и сохраняет высокую точность на стандартных тестовых наборах. (Katoh K, Rozewicki J, Yamada KD. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. 2019 Jul 19;20(4):1160-1166. doi: 10.1093/bib/bbx108. PMID: 28968734; PMCID: PMC6781576.)