Сравните выравнивания одних и тех же последовательностей разными программами
Для выравниваний рассматривались трансмембранные белки индуцирующие интерферон у человека и мышей(Interferon-induced transmembrane protein).
Выравнивая указаны в порядке: MUSCLE; MAFFT; CLUSTAL.
Таким образом, совпадающие колонки относительно выравниваниq по MUSCLE и MAFFT:
(s1,f1)
(s2,f2)
len
(22,28)
(22,28)
7
(40,48)
(42,50)
9
(50,55)
(52,57)
6
(57,127)
(59,129)
71
И относительно MUSCLE - CLUSTAL:
(42,48)
(42,48)
7
(51,55)
(51,55)
5
(53,128)
(53,128)
76
Как можно наблюдать, выравние muscle-mafft имеет наибольшее количество совпадающих колонок (92), в то время как muscle-clustal имеет 88. Но блоки, полученные при последних
алгоритмах, идентичны и полностью совпадают. Вероятно, алгоритмы имеют близкий принцип работы. Однако не стоит забывать об еще одном совпадающем блоке (22,28) полученом
в первом выравнивании. По результатам второй программы этот блок не совпадает. Предполагаю, что
необходимо сравнить выравнивание через другие программы, и в зависимости от результатов делать выводы, нужно рассматривать этот блок или же нет.
Сравнение выравниваний по совмещению структур и muscle
Для выравниваний были взяты белки из семейсва металлотионеинов с извесной пространственной структурой: 1DFS, 2FJ5, 2MRT.
Выравние при использовании muscle прошло без проблем, но при скачивании результатов выравнивания по пространственной структуре, один и тот же белок имел 2 варианта выравнивания.
Поэтому я решил попробовать изменить белок, но и при другом выравнивании результат был с такой же ситуацией. Поэтому дальнейшее сравнение рассматривается на изначальной
тройке белков. Скачиваемое выравнивание не совпадало с выравниванием с сайта PDB, поэтому я рассматривал последовательности с сайта, для этого я их перенес в jalview.
Однако схожих блоков было не так уж и много, всего 5 колонок[mus=pdb] (17,21)=(20,24). В пространственном выравнивании почти все цистеины сохраняют свои позиции
во всех выравниваниях. Вероятно, они состовляют основной каркас для молекул белка.
Рассмотрим программу множественного выравнивания MUSCLE. По результам выравниваний самая быстрая программа и в то же время она сохраняет
точность выравниваний. Работает в три этапа, сначала набрасывает примерное выравнивание (основываясь на степени сходности
и растояний), следующим этапом выравниение уточняется. На каждой стадии строится дерево выравниваний, на основе которого
происходит улучшение результатов. И в конце происходит обработка результатов и доведение их до итогового вывода.
Множество выравниваний сравнивают друг с другом и выбирается то, что имеет наибольший вес.