Отличия множественных выравниваний одних и тех же последовательностей

В данной работе был произведен поиск отличий между множественными выравниваниями последовательностей трех белков: TAL1_MOUSE, TAL1_DANRE, TAL1_HUMAN. Выравнивания были построены разными способами. Первое выравнивание (первая тройка) - программой Muscle, второе - программой Mafft, а третье - программой T-Coffee.

Отличие 1

Выделенный фрагмент показывает, что в выравнивани программой T-Coffee и Mafft, пролин (PRO(110), TAL1_DANRE) гомологичен аланину (ALA(104)) в двух другим последовательностях. Однако, программа Muscle, дает другой результат. Там пролин стоит дальше, на позиции 131, выравниваясь с другим пролином (PRO(109), TAL1_MOUSE), а под аланином - гэп.

Отличие 2

Все три программы дают разный результат в этом месте. Треонин (TAL1_DANRE, THR(264)) в Muscle занимает место в столбце 292, в Mafft этот треонин находится в 288 столбце, а в T-Coffee его место - столбец номер 302. Треонин, соотвественно, выравнивается с разными аминокислотами. Очень трудно предположить, какое из выравниваний здесь дает наилучший результат.

Отличие 3

В красной области можно видеть, как выравнивания Muscle(1) и T-Coffee(3) в столбце 343 показывают нам гомологичность аргинина (ARG(305)) и лизинов (LYS(311), LYS(309)) во всех трех последовательностях. В то время как Mafft дает этим двум лизинам другую позицию - столбец 345, при этом они соотвествуют гэпам в других последовательностях.
Отличий, конечно, намного больше, чем описано в данной работе. Они обусловлены особенностями самих программ и не кажутся столь важными и значительными. Большие гомологичные блоки выделяет каждая из программ. В этом можно убедиться, если посмотреть на проект в JalView. Сложно выделить какой-то один способ, но больше всего мне понравились Muscle и T-Coffee, потому что в них визуально меньше гэпов и больше одинаковых аминокислот стоит в одной колонке.

© Нестеренко Екатерина 2018