Алгоритмы и программы множественного выравнивания
Сравнение трех программ для выравнивания
Для выравнивания были выбранны те же последовательности, что и в практикуме 11. Для выравнивания использовались программы T-coffee, Muscle и Mafft. Для сравнения выравниваний был использован скрипт, написанный моей однокурсницей, Гончаровой Еленой (ссылка на скрипт). Результаты сравнения приведены в таблицах 1-4.
| № | T-Coffee | Mafft |
| 1 | (1,13) | (1,13) |
| 2 | (16,17) | (16,17) |
| 3 | (20,30) | (20,30) |
| 4 | (48,70) | (47,69) |
| 5 | (77,80) | (76,79) |
| 6 | (83,86) | (83,86) |
| № | T-Coffee/Mafft |
| 1 | (14,15) |
| 2 | (18,19) |
| 3 | (31,47) |
| 4 | (71,76) |
| 5 | (81,82) |
| № | T-Coffee | Muscle |
| 1 | (1,14) | (1,14) |
| 2 | (16,18) | (16,18) |
| 3 | (20,32) | (20,32) |
| 4 | (51,61) | (50,60) |
| 5 | (64,70) | (63,69) |
| 6 | (77,80) | (76,79) |
| 7 | (83,86) | (82,85) |
| № | T-Coffee/Muscle |
| 1 | (15,15) |
| 2 | (19,19) |
| 3 | (33,50) |
| 4 | (62,63) |
| 5 | (71,76) |
| 6 | (81,82) |
Программы Mafft и Muscle сравнивались с T-Coffee. При сравнении T-Coffee и Mafft (таблицы 1 и 2) было выявлено 6 блоков совпадения и 5 несовпадения, выравнивания совпадают на 66,3%. При сравнении T-Coffee и Muscle (таблицы 3 и 4) было выявлено 7 совпадающих и 6 несовпадающих участков, выравнивания совпали на 65,1%. Исходя из этих данных, можно сделать вывод, что для выравнивания данных последовательностей программы Mafft и Musscle эквивалентны. Проект Jalview
Сравнение структурного выравнивания и выравнивания программой MSA
| Сравниваемые программы | PDBeFold | T-coffee |
| Совпадающий блок 1 | (100,102) | (20, 22) |
| Совпадающий блок 2 | (143, 149) | (54, 60) |
| Совпадающий блок 3 | (155, 160) | (66, 71) |
| Совпадающий блок 4 | (171, 173) | (80, 82) |
| Сравниваемые программы | PDBeFold | T-coffee |
| Несовпадающий блок 1 | (1, 99) | (1, 19) |
| Несовпадающий блок 2 | (103, 142) | (23, 53) |
| Несовпадающий блок 3 | (150, 154) | (61, 65) |
| Несовпадающий блок 4 | (161, 170) | (72, 79) |
| Несовпадающий блок 5 | (174, 266) | (83, 256) |
Результаты сравнения представлены в таблицах 5 и 6. По ним видно, что выравнивания имеют мало схожих колонок (всего 17). Можно предположить, что программы по разному выравняли последовательности из-за их низкого сходства. Это можно увидеть на 3D наложении их структур (рисунок 1).
Алгоритм T-Coffee
T-Coffee (Tree-based Consistency Objective Function for Alignment Evaluation) -
это программа множественного прогрессивного выравнивания, основанная на консистентности. То есть программа сначала составляет библиотеку из всех возможных парных выравниваний последовательностей, используя сторонние сервисы, и только затем строит направляющее древо. Это позволяет снизить риск появления ошибки на ранних этапах и искажения итоговых результатов. Первая версия T-coffee использует ClustalW и Lalign. У программы существуют разные режимы: стандартный T-Coffee, M-Coffee (сравнение и объединение готовых множественных выравниваний, R-Coffee (выравнивание РНК с учетом предсказанной вторичной структуры), Expresso (выравнивание белковых последовательностей с известной 3D структурой).
Di Tommaso P. et al. T-Coffee: a web server for the multiple sequence alignment of protein and RNA sequences using structural information and homology extension //Nucleic acids research. – 2011. – Т. 39. – №. suppl_2. – С. W13-W17.