Программа подсчёта инделей:
Для глобального и локального выравнивания для белков с мнемоникой PYRB, PGK и SODM
Глобальное парное выравнивание гомологичных белков:
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Aspartate carbamoyltransferase catalytic subunit | PYRB_ECOLI | PYRB_BACSU | 393 | 31,7 | 49,8 | 47 | 14 |
| Phosphoglycerate kinase | PGK_ECOLI | PGK_BACSU | 908.0 | 47.4 | 66.7% | 17 | 7 |
| Superoxide dismutase [Mn] | SODM_ECOLI | SODM_BACSU | 639.5 | 58.9 | 66.5 | 10 | 3 |
Локальное парное выравнивание гомологичных белков
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Aspartate carbamoyltransferase catalytic subunit | PYRB_ECOLI | PYRB_BACSU | 393 | 31,7 | 49,8 | 47 | 12 | 0,97 | 0,97 |
| Phosphoglycerate kinase | PGK_ECOLI | PGK_BACSU | 908 | 48.1 | 67.5 | 14 | 6 | 0.956 | 0.992 |
| Superoxide dismutase [Mn] | SODM_ECOLI | SODM_BACSU | 639.5 | 58.9 | 66.5 | 10 | 3 | 0.946 | 0.995 |
На основе анализа:
PYRB: высокое покрытие (>96%), но умеренная идентичность (~32%) - белки гомологичны по всей длине
PGK: Высокие показатели по всем параметрам - белки тоже гомологичны
SODM: Наивысшая идентичность (~59%) - наиболее консервативные белки из трех пар
Для всех трех пар локальное выравнивание показывает немного лучшие показатели (выше score, меньше gaps), что ожидаемо для гомологичных белков.
Локальное парное выравнивание гомологичных белков
| Algorithm | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| needle | ZAPA_ECOLI | TRXB_BACSU | 16.5 | 8,1 | 13,1 | 215 | 7 | - | - |
| water | ZAPA_ECOLI | TRXB_BACSU | 28.5 | 24.2 | 41.9 | 12 | 3 | 0.20 | 0.21 |
Сравнение неродственных белков ZAPA_ECOLI и TRXB_BACSU показывает характерные различия между алгоритмами. Глобальное выравнивание (needle) вынуждено "растянуть" последовательности друг на друга, что приводит к очень низкому score, идентичности и огромному количеству гэпов. Локальное выравнивание (water) нашло один короткий участок случайного сходства с относительно высокими процентами (24.2% идентичности), но крайне низкое покрытие (~20%) и общий score доказывают отсутствие гомологии между этими белками.
Множественное выравнивание белков
В Swiss-Prot я выбрала белки с мнемоникой SODM. Всего нашлось 325 белков. Я выбрала: SODM_MOUSE; SODM_ARATH; SODM_BACSU; SODM_DROME; SODM_ECOLI; SODM_YEAST; SODM_HUMAN. В программе Jalview было проведено множественное выравнивание (Web Service -> Alignment -> Muscle with Defaults). Затем данное выравнивание было сохранео как проект Jalview.
При выравнивании белка видно консервативные участки: 37,38,40,46-49,59,62-65,67,68,109,110,113,114,117,118,121,136,140,146,163-166,169,179,186-188,201,205,210,212-218,222,227,232,236,237.
Всего 48 гомологичных столбцов.