Сравните выравнивания одних и тех же последовательностей разными программами

Для выравниваний рассматривались трансмембранные белки индуцирующие интерферон у человека и мышей(Interferon-induced transmembrane protein). Выравнивая указаны в порядке: MUSCLE; MAFFT; CLUSTAL.

Ссылка на проект

Таким образом, совпадающие колонки относительно выравниваниq по MUSCLE и MAFFT:

(s1,f1) (s2,f2) len
(22,28) (22,28) 7
(40,48) (42,50) 9
(50,55) (52,57) 6
(57,127) (59,129) 71

И относительно MUSCLE - CLUSTAL:

(42,48) (42,48) 7
(51,55) (51,55) 5
(53,128) (53,128) 76
Как можно наблюдать, выравние muscle-mafft имеет наибольшее количество совпадающих колонок (92), в то время как muscle-clustal имеет 88. Но блоки, полученные при последних алгоритмах, идентичны и полностью совпадают. Вероятно, алгоритмы имеют близкий принцип работы. Однако не стоит забывать об еще одном совпадающем блоке (22,28) полученом в первом выравнивании. По результатам второй программы этот блок не совпадает. Предполагаю, что необходимо сравнить выравнивание через другие программы, и в зависимости от результатов делать выводы, нужно рассматривать этот блок или же нет.

Сравнение выравниваний по совмещению структур и muscle

Для выравниваний были взяты белки из семейсва металлотионеинов с извесной пространственной структурой: 1DFS, 2FJ5, 2MRT. Выравние при использовании muscle прошло без проблем, но при скачивании результатов выравнивания по пространственной структуре, один и тот же белок имел 2 варианта выравнивания. Поэтому я решил попробовать изменить белок, но и при другом выравнивании результат был с такой же ситуацией. Поэтому дальнейшее сравнение рассматривается на изначальной тройке белков. Скачиваемое выравнивание не совпадало с выравниванием с сайта PDB, поэтому я рассматривал последовательности с сайта, для этого я их перенес в jalview. Однако схожих блоков было не так уж и много, всего 5 колонок[mus=pdb] (17,21)=(20,24). В пространственном выравнивании почти все цистеины сохраняют свои позиции во всех выравниваниях. Вероятно, они состовляют основной каркас для молекул белка.

Ссылка на проект

Описание программ MSA

Рассмотрим программу множественного выравнивания MUSCLE. По результам выравниваний самая быстрая программа и в то же время она сохраняет точность выравниваний. Работает в три этапа, сначала набрасывает примерное выравнивание (основываясь на степени сходности и растояний), следующим этапом выравниение уточняется. На каждой стадии строится дерево выравниваний, на основе которого происходит улучшение результатов. И в конце происходит обработка результатов и доведение их до итогового вывода. Множество выравниваний сравнивают друг с другом и выбирается то, что имеет наибольший вес.