Отличия множественных выравниваний одних и тех же последовательностей
В данной работе был произведен поиск отличий между множественными выравниваниями последовательностей трех белков:
TAL1_MOUSE, TAL1_DANRE, TAL1_HUMAN. Выравнивания были построены разными способами. Первое выравнивание (первая тройка) - программой Muscle,
второе - программой Mafft, а третье - программой T-Coffee.
Отличие 1
Выделенный фрагмент показывает, что в выравнивани программой T-Coffee и Mafft, пролин (PRO(110), TAL1_DANRE) гомологичен аланину (ALA(104)) в
двух другим последовательностях. Однако, программа Muscle, дает другой результат. Там пролин стоит дальше, на позиции 131, выравниваясь с другим пролином (PRO(109), TAL1_MOUSE), а под аланином - гэп.
Отличие 2
Все три программы дают разный результат в этом месте. Треонин (TAL1_DANRE, THR(264)) в Muscle занимает место в столбце 292, в Mafft этот треонин
находится в 288 столбце, а в T-Coffee его место - столбец номер 302. Треонин, соотвественно, выравнивается с разными аминокислотами. Очень трудно предположить, какое из выравниваний здесь дает наилучший результат.
Отличие 3
В красной области можно видеть, как выравнивания Muscle(1) и T-Coffee(3) в столбце 343 показывают нам гомологичность аргинина (ARG(305)) и лизинов (LYS(311), LYS(309))
во всех трех последовательностях. В то время как Mafft дает этим двум лизинам другую позицию - столбец 345, при этом они соотвествуют гэпам в других последовательностях.
Отличий, конечно, намного больше, чем описано в данной работе. Они обусловлены особенностями самих программ и не кажутся столь важными и значительными.
Большие гомологичные блоки выделяет каждая из программ. В этом можно убедиться, если посмотреть на
проект в JalView.
Сложно выделить какой-то один способ, но больше всего мне понравились Muscle и T-Coffee, потому что в них визуально меньше гэпов и больше одинаковых аминокислот стоит в одной колонке.
© Нестеренко Екатерина 2018