Практикум 12

Сравнение выравниваний одних и тех же последовательностей разными программами

Использованные программы: ClustalO, Tcoffee, Muscle

Сравнение выравнивания ClustalO с выравниванием Tcoffee

Значение Информация
(ClustalO VS Tcoffee)
Примеры совпадающих блоков

(17,27)=(18,28)
(148,164)=(157,173)
(168,461)=(177,470)

Примеры несовпадающих блоков

(1,16) и (1,17)
(28,32) и (29,33)
(51,81) и (52,89)

Сравнение выравнивания ClustalO с выравниванием Muscle

Значение Информация
(ClustalO VS Muscle)
Примеры совпадающих блоков

(11,28)=(11,28)
(36,50)=(36,50)
(81,87)=(83,89)

Примеры несовпадающих блоков

(1,10) и (1,10)
(29,36) и (29,36)
(51,80) и (51,82)

Заключение

Во-первых, можно заметить, что при двух сравнениях выделяются очень схожие совпадающие и несовпадающие блоки. То есть различия в результате работы ClustalO и Tcoffee похожи на различия в результате работы ClustalO и Muscle. Например, несовпадающие блоки (28,32) и (29,33) в первом сравнении и (29,36) и (29,36) во втором сравнении.
Во-вторых, судя по score, который выдавал VerAlign, результат работы ClustalO больше похож на результат работы Muscle, чем на результат работы Tcoffee.
К сожалению, не могу прикрепить скриншот, так как сервис VerAlign внезапно перестал у меня загружатся.
Ссылки на файлы с выравниваниями в сопроводительных материалах внизу страницы.

Сравнение выравнивания по совмещению структур с выравниванием MSA

Сравнивалось выравнивание при помощи Expresso и MSA (Tcoffee из Jalview).
Структуры у этих белков есть, вот ссылки:
1
2
3

Значение Информация
(ClustalO VS Tcoffee)
Совпадающие блоки

(60,73)=(62,75)
(94,108)=(97,109)
(113,160)=(116,163)

Несовпадающие блоки

(1,59) и (1,61)
(74,93) и (76,96)
(109,112) и (110,115)

Проект Jalview с этими выравниваниями в сопроводительных материалах. Можно сделать вывод, что и выравнивание по последовательности и выравнивание, использующее структурные данные дает похожие результаты. Совпадающие блоки больше, чем несовпадающие по суммарной длине.

Описание ClustalO

ClustalO — это программа прогрессивного выравнивания. Она довольно точная в сравнении с более ранними программами Clustal за счёт использования метода HHalig, и при этом быстрая и может работать на маломощных устройствах для большого количества последовательностей благодаря использованию алгоритма mBED.

Как она работает:
1. Попарное выравнивание последовательностей (как и в других программах прогрессивного выравнивания), но в данном случае оно делается с использованием эвристического алгоритма. Он не гарантирует нахождение оптимального выравнивания, но работает быстрее.
2. Кластеризация последовательностей при помощи метода mBed.
3. Применяется метод Метод k-средних.
4. Строится дерево последовательностей (как и в других программах прогрессивного выравнивания) одним из методов расстояний — методом UPGMA (метод невзвешенного попарного среднего). 5. Окончательное выравнивание получается с помощью программы HHAlign из HH-Suite с использованием двух профилей HMM (скрытых марковских моделей).

СОПРОВОДИТЕЛЬНЫЕ МАТЕРИАЛЫ

  1. Проект Jalview с тремя выравниваниями
  2. Выравнивание с помощью ClustalO
  3. Выравнивание с помощью Tcoffee
  4. Выравнивание с помощью Muscle
  5. Проект Jalview с двумя выравниваниями (для задания с выравниванием по структуре)

ЛИТЕРАТУРА

  1. Sievers, F., Higgins, D.G. (2014). Clustal Omega, Accurate Alignment of Very Large Numbers of Sequences. In: Russell, D. (eds) Multiple Sequence Alignment Methods. Methods in Molecular Biology, vol 1079. Humana Press, Totowa, NJ. https://doi.org/10.1007/978-1-62703-646-7_6