Отличия в выравниваниях

В данной работе были исследованы на различия множественные выравнивания последовательностей GLGNB_SYNE7, GLGB_ECOLI, GLGD_DICCH (на скриншотах в том же порядке сверху вниз).

Далее приведен сам файл сравнения, скачать его можно в дфух форматах:

Скачать в формате JVP

Скачать в формате MFA

На продемонстрированых скриншотах первое выравнивание сделано с помощью программы T-coffee, второе - Muscle, третье - Mafft. (В приложенных файлах группы проименованы в соотвествии с именем программы)

Ошибка 1:

Выравнивания отличаются 2мя позициями: позиция инделя и позиция АК-остатка.

В большинстве случаев такая ошибка возникает в выравнивании из программы T-coffee.

В случае учета в афинных штрафах позиции гэпа относительно других гэпов при наличии такой ошибки может измениться вес выравнивания, так что эту ошибку можно считать существенной (Пример: -A-A имеет больший вес, чем A--A).

Однако такая ошибка встречается не только в T-coffee - вот пример этой ошибки для программы Mafft в том же файле:

Рассмотрим последнее выравнивание подробно: в верхних выравниваниях в последовательности GLGB_SYNE7 Alanin стоит на позиции 179, а в последнем выравнивании в той же последовательности Alanine стоит на другой позиции - 180. Из-за наличия такой небольшой ошибки становится сложно рассуждать о гомологичности Alanine из последовательности GLGB_SYNE7 с Arginine из последовательносте GLGB_ECOLI (Arg на 179), GLGB_DICCH (Arg на 179 и на 180) или с Leucine из последовательности GLGB_ECOLI (Leu на 180)

Ошибки 5-9:

В целом выранивание T-coffee имеет больше всего несоответствий с отстальными выравниваниями:

В связи с таким большим количеством несоответствий я решила проверить некоторые из ошибок по раскарске Color CristalX. Результат мне не понравился, но выглядит он красиво. Если судить по соответствию цветов, в которые окрашивались участки, находясь на разных позициях, T-coffee раскрашен менее интенсивно и менее сопоставимо c остальными выравниваниями, тогда как раскашенные Mafft и Muscle хорошо сопоставимы между собой в местах ошибок (пример3), но это сопоставление может легко расходится в других выравниваниях, в данном случае ошибки между этими двумя выравниваниями минимальны.

Ошибки 10 и 11:

В данном случае все три выравнивания не соответствуют друг другу. Тем не менее даже в этом случае выравнивание программой T-coffee отличается сильнее всех.

Итог:

Меньше всего "ошибок" оказалось в выравнивании программой Muscle (их всего 2 в тех случаях, где "ошиблись" все).

Следующим по числу ошибок (и степени моего доверия) является выравнивание Mafft - 3 "ошибки" (включая два "особых" случая 10 и 11).

T-coffee по сравнению с предыдущими выравниваниями выдал наибольшее число несоответствий - из 10 из 11ти.


© Grigoreva Masha