Отличия в выравниваниях
В данной работе были исследованы на различия множественные выравнивания последовательностей GLGNB_SYNE7, GLGB_ECOLI, GLGD_DICCH (на скриншотах в том же порядке сверху вниз).
Далее приведен сам файл сравнения, скачать его можно в дфух форматах:
На продемонстрированых скриншотах первое выравнивание сделано с помощью программы T-coffee, второе - Muscle, третье - Mafft. (В приложенных файлах группы проименованы в соотвествии с именем программы)
Ошибка 1:
Выравнивания отличаются 2мя позициями: позиция инделя и позиция АК-остатка.
В большинстве случаев такая ошибка возникает в выравнивании из программы T-coffee.
В случае учета в афинных штрафах позиции гэпа относительно других гэпов при наличии такой ошибки может измениться вес выравнивания, так что эту ошибку можно считать существенной (Пример: -A-A имеет больший вес, чем A--A).
Однако такая ошибка встречается не только в T-coffee - вот пример этой ошибки для программы Mafft в том же файле:
Рассмотрим последнее выравнивание подробно: в верхних выравниваниях в последовательности GLGB_SYNE7 Alanin стоит на позиции 179, а в последнем выравнивании в той же последовательности Alanine стоит на другой позиции - 180. Из-за наличия такой небольшой ошибки становится сложно рассуждать о гомологичности Alanine из последовательности GLGB_SYNE7 с Arginine из последовательносте GLGB_ECOLI (Arg на 179), GLGB_DICCH (Arg на 179 и на 180) или с Leucine из последовательности GLGB_ECOLI (Leu на 180)
Ошибки 5-9:
В целом выранивание T-coffee имеет больше всего несоответствий с отстальными выравниваниями:
В связи с таким большим количеством несоответствий я решила проверить некоторые из ошибок по раскарске Color CristalX. Результат мне не понравился, но выглядит он красиво. Если судить по соответствию цветов, в которые окрашивались участки, находясь на разных позициях, T-coffee раскрашен менее интенсивно и менее сопоставимо c остальными выравниваниями, тогда как раскашенные Mafft и Muscle хорошо сопоставимы между собой в местах ошибок (пример3), но это сопоставление может легко расходится в других выравниваниях, в данном случае ошибки между этими двумя выравниваниями минимальны.
Ошибки 10 и 11:
В данном случае все три выравнивания не соответствуют друг другу. Тем не менее даже в этом случае выравнивание программой T-coffee отличается сильнее всех.
Итог:
Меньше всего "ошибок" оказалось в выравнивании программой Muscle (их всего 2 в тех случаях, где "ошиблись" все).
Следующим по числу ошибок (и степени моего доверия) является выравнивание Mafft - 3 "ошибки" (включая два "особых" случая 10 и 11).
T-coffee по сравнению с предыдущими выравниваниями выдал наибольшее число несоответствий - из 10 из 11ти.
© Grigoreva Masha