Выравнивания в формате FASTA:
1. T-Coffee
2. Muscle
3. Mafft
Для получения сравнения выравниваний использовался код написанный моей однокурсницей
| № | Muscle | Mafft |
|---|---|---|
| 1 | (25,38) | (28,41) |
| 2 | (58,60) | (56,58) |
| 3 | (106,110) | (111,115) |
| 4 | (418,421) | (460,463) |
| 5 | (457,473) | (500,516) |
| 6 | (484,527) | (527,570) |
| 7 | (542,566) | (579,603) |
| 8 | (718,724) | (796,802) |
| 9 | (573,627) | (610,664) |
| № | Muscle | Mafft |
|---|---|---|
| 1 | (1, 24) | (1, 27) |
| 2 | (39, 57) | (42, 55) |
| 3 | (61, 105) | (59, 110) |
| 4 | (111, 417) | (116-459) |
| 5 | (422, 456) | (464, 499) |
| 6 | (474, 483) | (517, 526) |
| 7 | (528, 541) | (571, 578) |
| 8 | (567, 572) | (604, 609) |
| 9 | (628,717) | (665, 795) |
Также в данных выравниваниях присутствуют совпадающие колонки вне блоков: (11,11), (666,629) для Muscle и Mafft соответственно.
При сравнении программ было обнаружено 9 совпадающих блоков (160 колонок) самый длинный из которых состоял из 55 колонок. Большое количество длинных блоков совпадений свидетельствует о схожести в работе этих алгоритмов.
| № | Mafft | T-Coffee |
|---|---|---|
| 1 | (29,41) | (30,42) |
| 2 | (57,58) | (57,58) |
| 3 | (111,114) | (110,113) |
| 4 | (281,282) | (290,291) |
| 5 | (327,357) | (357,387) |
| 6 | (360,375) | (390,405) |
| 7 | (435,444) | (468,477) |
| 8 | (411,414) | (444,447) |
| 9 | (460,463) | (493,496) |
| 10 | (500,516) | (535,551) |
| 11 | (527,563) | (562,598) |
| 12 | (580,592) | (615,627) |
| 13 | (597,603) | (632,638) |
| 14 | (620,622) | (676,678) |
| 15 | (642,664) | (865,887) |
| 16 | (796,802) | (978,984) |
| № | Mafft | T-Coffee |
|---|---|---|
| 1 | (1,28) | (1,29) |
| 2 | (42, 56) | (43, 56) |
| 3 | (59, 110) | (59-109) |
| 4 | (115, 280) | (114, 289) |
| 5 | (283, 326) | (292, 356) |
| 6 | (358, 359) | (388, 389) |
| 7 | (376, 410) | (406, 443) |
| 8 | (415, 434) | (448, 467) |
| 9 | (445, 459) | (478, 492) |
| 10 | (464, 499) | (497, 534) |
| 11 | (517, 526) | (552, 561) |
| 12 | (564, 579) | (599, 614) |
| 13 | (593, 596) | (628, 631) |
| 14 | (604, 619) | (639, 675) |
| 15 | (623, 641) | (679, 864) |
| 16 | (665, 795) | (888, 977) |
Также присутствует четыре совпадения вне блоков: колонки (27, 26), (277,286), (570,605), (666,889) Для Mafft и T-Coffee соответственно.
Было обнаружено 16 блоков совпадения (180 колонок), самый длинный из которых был длиной 37 а.к.о.
Процент совпадения Mafft с Muscle и T-Coffee равны 21.9% и 24.6% соответственно. Выравнивания имеют схожие количества совпадающих колонок, однако число блоков отличается почти в два раза. Возможно это связанно с особенностями строения белка и спецификой работы каждой из программ.
Выравнивания в формате FASTA:
| № | Muscle | PDBeFold |
|---|---|---|
| 1 | (1, 105) | (1, 105) |
| 2 | (142, 170) | (143, 171) |
| 3 | (183, 214) | (184, 215) |
| 4 | (579, 594) | (878, 893) |
| № | Muscle | PDBeFold |
|---|---|---|
| 1 | (106, 141) | (106, 142) |
| 2 | (171,182) | (171, 183) |
| 3 | (215,578) | (216, 877) |
Были проанализированы выравнивания 3х последовательсностей А-цепей белков из домена 7 transmembrane receptor (rhodopsin family) (PF00001): 4K5Y, 5EE7, 6FJ3. Имеется четыре схожих блоков в выравниваниях длиной 105, 32, 29 и 15 а.о. Можно сделать вывод, что Muscle правильно выравнял последовательности, близко к структурному.
T-coffee (Tree-based Consistency Objective Function for Alignment Evaluation) - программное обеспечение для выравнивания нескольких последовательностей. Программа основана на прогрессивном выравнивании. Впервые было представлено в 2000 году. Разработчики: Cédric Notredame, Centro de Regulacio Genomica (CRG) - Барселона.
На что способна эта программа: