Алгоритмы и программы множественного выравнивания

Сравнение трех программ для выравнивания

Для выравнивания были выбранны те же последовательности, что и в практикуме 11. Для выравнивания использовались программы T-coffee, Muscle и Mafft. Для сравнения выравниваний был использован скрипт, написанный моей однокурсницей, Гончаровой Еленой (ссылка на скрипт). Результаты сравнения приведены в таблицах 1-4.

Таблица 1. Совпадающие участки выравнивания T-Coffee/Mafft
T-Coffee Mafft
1 (1,13) (1,13)
2 (16,17) (16,17)
3 (20,30) (20,30)
4 (48,70) (47,69)
5 (77,80) (76,79)
6 (83,86) (83,86)

Таблица 2. Несовпадающие участки выравнивания T-Coffee/Mafft
T-Coffee/Mafft
1 (14,15)
2 (18,19)
3 (31,47)
4 (71,76)
5 (81,82)

Таблица 3. Совпадающие участки выравнивания T-Coffee/Muscle
T-Coffee Muscle
1 (1,14) (1,14)
2 (16,18) (16,18)
3 (20,32) (20,32)
4 (51,61) (50,60)
5 (64,70) (63,69)
6 (77,80) (76,79)
7 (83,86) (82,85)

Таблица 4. Несовпадающие участки выравнивания T-Coffee/Muscle
T-Coffee/Muscle
1 (15,15)
2 (19,19)
3 (33,50)
4 (62,63)
5 (71,76)
6 (81,82)

Программы Mafft и Muscle сравнивались с T-Coffee. При сравнении T-Coffee и Mafft (таблицы 1 и 2) было выявлено 6 блоков совпадения и 5 несовпадения, выравнивания совпадают на 66,3%. При сравнении T-Coffee и Muscle (таблицы 3 и 4) было выявлено 7 совпадающих и 6 несовпадающих участков, выравнивания совпали на 65,1%. Исходя из этих данных, можно сделать вывод, что для выравнивания данных последовательностей программы Mafft и Musscle эквивалентны. Проект Jalview

Сравнение структурного выравнивания и выравнивания программой MSA

Проект Jalview

align
Рис.1 Совмещение 3D-структур (Зеленый - 1hpk:A; красный - 1a0h:A; голубой - 1ki0:A)
Таблица 5. Совпадающие участки выравнивания
Сравниваемые программы PDBeFold T-coffee
Совпадающий блок 1 (100,102) (20, 22)
Совпадающий блок 2 (143, 149) (54, 60)
Совпадающий блок 3 (155, 160) (66, 71)
Совпадающий блок 4 (171, 173) (80, 82)

Таблица 6. Несовпадающие участки выравнивания
Сравниваемые программы PDBeFold T-coffee
Несовпадающий блок 1 (1, 99) (1, 19)
Несовпадающий блок 2 (103, 142) (23, 53)
Несовпадающий блок 3 (150, 154) (61, 65)
Несовпадающий блок 4 (161, 170) (72, 79)
Несовпадающий блок 5 (174, 266) (83, 256)

Результаты сравнения представлены в таблицах 5 и 6. По ним видно, что выравнивания имеют мало схожих колонок (всего 17). Можно предположить, что программы по разному выравняли последовательности из-за их низкого сходства. Это можно увидеть на 3D наложении их структур (рисунок 1).

Алгоритм T-Coffee

T-Coffee (Tree-based Consistency Objective Function for Alignment Evaluation) - это программа множественного прогрессивного выравнивания, основанная на консистентности. То есть программа сначала составляет библиотеку из всех возможных парных выравниваний последовательностей, используя сторонние сервисы, и только затем строит направляющее древо. Это позволяет снизить риск появления ошибки на ранних этапах и искажения итоговых результатов. Первая версия T-coffee использует ClustalW и Lalign. У программы существуют разные режимы: стандартный T-Coffee, M-Coffee (сравнение и объединение готовых множественных выравниваний, R-Coffee (выравнивание РНК с учетом предсказанной вторичной структуры), Expresso (выравнивание белковых последовательностей с известной 3D структурой).

Di Tommaso P. et al. T-Coffee: a web server for the multiple sequence alignment of protein and RNA sequences using structural information and homology extension //Nucleic acids research. – 2011. – Т. 39. – №. suppl_2. – С. W13-W17.