Practice 12

Сравнение выравниваний одних и тех же последовательностей разными программами

Использованные программы: ClustalO, Tcoffee, Muscle

Сравнение выравнивания ClustalO с выравниванием Tcoffee

Значение	Информация (ClustalO VS Tcoffee)
Примеры совпадающих блоков	(17,27)=(18,28) (148,164)=(157,173) (168,461)=(177,470)
Примеры несовпадающих блоков	(1,16) и (1,17) (28,32) и (29,33) (51,81) и (52,89)

Сравнение выравнивания ClustalO с выравниванием Muscle

Значение	Информация (ClustalO VS Muscle)
Примеры совпадающих блоков	(11,28)=(11,28) (36,50)=(36,50) (81,87)=(83,89)
Примеры несовпадающих блоков	(1,10) и (1,10) (29,36) и (29,36) (51,80) и (51,82)

Заключение

Во-первых, можно заметить, что при двух сравнениях выделяются очень схожие совпадающие и несовпадающие блоки. То есть различия в результате работы ClustalO и Tcoffee похожи на различия в результате работы ClustalO и Muscle. Например, несовпадающие блоки (28,32) и (29,33) в первом сравнении и (29,36) и (29,36) во втором сравнении.
Во-вторых, судя по score, который выдавал VerAlign, результат работы ClustalO больше похож на результат работы Muscle, чем на результат работы Tcoffee.
К сожалению, не могу прикрепить скриншот, так как сервис VerAlign внезапно перестал у меня загружатся.
Ссылки на файлы с выравниваниями в сопроводительных материалах внизу страницы.

Сравнение выравнивания по совмещению структур с выравниванием MSA

Сравнивалось выравнивание при помощи Expresso и MSA (Tcoffee из Jalview).
Структуры у этих белков есть, вот ссылки:
1
2
3

Значение	Информация (ClustalO VS Tcoffee)
Совпадающие блоки	(60,73)=(62,75) (94,108)=(97,109) (113,160)=(116,163)
Несовпадающие блоки	(1,59) и (1,61) (74,93) и (76,96) (109,112) и (110,115)

Проект Jalview с этими выравниваниями в сопроводительных материалах. Можно сделать вывод, что и выравнивание по последовательности и выравнивание, использующее структурные данные дает похожие результаты. Совпадающие блоки больше, чем несовпадающие по суммарной длине.

Описание ClustalO

ClustalO — это программа прогрессивного выравнивания. Она довольно точная в сравнении с более ранними программами Clustal за счёт использования метода HHalig, и при этом быстрая и может работать на маломощных устройствах для большого количества последовательностей благодаря использованию алгоритма mBED.

Как она работает:
1. Попарное выравнивание последовательностей (как и в других программах прогрессивного выравнивания), но в данном случае оно делается с использованием эвристического алгоритма. Он не гарантирует нахождение оптимального выравнивания, но работает быстрее.
2. Кластеризация последовательностей при помощи метода mBed.
3. Применяется метод Метод k-средних.
4. Строится дерево последовательностей (как и в других программах прогрессивного выравнивания) одним из методов расстояний — методом UPGMA (метод невзвешенного попарного среднего). 5. Окончательное выравнивание получается с помощью программы HHAlign из HH-Suite с использованием двух профилей HMM (скрытых марковских моделей).

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

ЛИТЕРАТУРА

Sievers, F., Higgins, D.G. (2014). Clustal Omega, Accurate Alignment of Very Large Numbers of Sequences. In: Russell, D. (eds) Multiple Sequence Alignment Methods. Methods in Molecular Biology, vol 1079. Humana Press, Totowa, NJ. https://doi.org/10.1007/978-1-62703-646-7_6

Практикум 12