Использованные программы: ClustalO, Tcoffee, Muscle
Значение | Информация (ClustalO VS Tcoffee) |
---|---|
Примеры совпадающих блоков |
(17,27)=(18,28) |
Примеры несовпадающих блоков |
(1,16) и (1,17) |
Значение | Информация (ClustalO VS Muscle) |
---|---|
Примеры совпадающих блоков |
(11,28)=(11,28) |
Примеры несовпадающих блоков |
(1,10) и (1,10) |
Во-первых, можно заметить,
что при двух сравнениях выделяются очень схожие
совпадающие и несовпадающие блоки.
То есть различия в результате работы ClustalO и Tcoffee
похожи на различия в результате работы ClustalO и Muscle.
Например, несовпадающие блоки (28,32) и (29,33) в первом сравнении и (29,36) и (29,36) во втором сравнении.
Во-вторых, судя по score, который выдавал VerAlign,
результат работы ClustalO больше похож на результат работы Muscle, чем на результат работы Tcoffee.
К сожалению, не могу прикрепить скриншот, так как сервис VerAlign внезапно перестал у меня загружатся.
Ссылки на файлы с выравниваниями в сопроводительных материалах внизу страницы.
Сравнивалось выравнивание при помощи Expresso и MSA (Tcoffee из Jalview).
Структуры у этих белков есть, вот ссылки:
1
2
3
Значение | Информация (ClustalO VS Tcoffee) |
---|---|
Совпадающие блоки |
(60,73)=(62,75) |
Несовпадающие блоки |
(1,59) и (1,61) |
Проект Jalview с этими выравниваниями в сопроводительных материалах. Можно сделать вывод, что и выравнивание по последовательности и выравнивание, использующее структурные данные дает похожие результаты. Совпадающие блоки больше, чем несовпадающие по суммарной длине.
ClustalO — это программа прогрессивного выравнивания.
Она довольно точная в сравнении с более ранними программами
Clustal за счёт использования метода HHalig, и при этом быстрая
и может работать на маломощных устройствах для большого количества
последовательностей благодаря использованию алгоритма mBED.
Как она работает:
1. Попарное выравнивание последовательностей
(как и в других программах прогрессивного выравнивания),
но в данном случае оно делается с использованием
эвристического алгоритма.
Он не гарантирует нахождение оптимального выравнивания,
но работает быстрее.
2. Кластеризация последовательностей при помощи метода mBed.
3. Применяется метод Метод k-средних.
4. Строится дерево последовательностей
(как и в других программах прогрессивного выравнивания)
одним из методов расстояний — методом UPGMA
(метод невзвешенного попарного среднего).
5. Окончательное выравнивание получается с помощью программы
HHAlign из HH-Suite с использованием двух профилей HMM
(скрытых марковских моделей).
Sievers, F., Higgins, D.G. (2014). Clustal Omega, Accurate Alignment of Very Large Numbers of Sequences. In: Russell, D. (eds) Multiple Sequence Alignment Methods. Methods in Molecular Biology, vol 1079. Humana Press, Totowa, NJ. https://doi.org/10.1007/978-1-62703-646-7_6