protein name | id 1 | id 2 | score | % identity | % similarity | gaps | indels |
---|---|---|---|---|---|---|---|
Acyl carrier protein | ACP_BACSU | ACP_ECOLI | 216.0 | 60.3% | 71.8% | 1 | 1 |
Holo-[acyl-carrier-protein] synthase | ACPS_BACSU | ACPS_ECOLI | 192.0 | 36.6% | 52.7% | 15 | 5 |
Acylphosphatase | ACYP_BACSU | ACYP_ECOLI | 141.5 | 32.4% | 45.4% | 33 | 3 |
protein name | id 1 | id 2 | score | % identity | % similarity | gaps | indels | coverage 1 | coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Acyl carrier protein | ACP_BACSU | ACP_ECOLI | 216.0 | 61.0% | 72.7% | 0 | 0 | 100.0% | 98.7% |
Holo-[acyl-carrier-protein] synthase | ACPS_BACSU | ACPS_ECOLI | 194.0 | 38.4% | 55.2% | 11 | 3 | 95.9% | 97.6 |
Acylphosphatase | ACYP_BACSU | ACYP_ECOLI | 150.0 | 42.9% | 59.7% | 5 | 1 | 84.6% | 78.3% |
Первые две послдедовательности очевидно гомологичны на всей длине, и локальное выравнивание информативно только тем, что подтверждает это. А вот вторая и третья пара имеют более низкий процент совпадения, но все же значительный для случайности. Вероятно они просто сильнее разошлись. Вторая пара гомологична на всей длине, а в третьей присутствует крупный более консервативный участок. Соответственно для третьей пары локальное выравнивание наиболее информативно
protein names | id 1 | id 2 | score | % identity | % similarity | gaps | indels |
---|---|---|---|---|---|---|---|
Surfactin synthase subunit 3 (and) Translocation and assembly module subunit TamB |
SRFAC_BACSU | TAMB_ECOLI | 71.5 | 13.1% | 23.1% | 952 | 69 |
C4-dicarboxylate transport protein (and) Protein FixC |
DCTA_BACSU | FIXC_ECOLI | 43.0 | 4.7% | 7.4% | 633 | 10 |
Polyketide synthase PksN (and) Protein EvgL |
PKSN_BACSU | EVGL_ECOLI | 22.0 | 0.1% | 0.1% | 5479 | 2 |
protein names | id 1 | id 2 | score | % identity | % similarity | gaps | indels | coverage 1 | coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Surfactin synthase subunit 3 (and) Translocation and assembly module subunit TamB |
SRFAC_BACSU | TAMB_ECOLI | 89.0 | 18.4% | 34.9% | 172 | 28 | 39.2% | 39.9% |
C4-dicarboxylate transport protein (and) Protein FixC |
DCTA_BACSU | FIXC_ECOLI | 48.0 | 26.3% | 40.1% | 41 | 11 | 25.9% | 29.0% |
Polyketide synthase PksN (and) Protein EvgL |
PKSN_BACSU | EVGL_ECOLI | 27.0 | 50.0% | 100% | 0 | 0 | 0.1% | 66.7% |
Три пары белков были намеренно выбраны с определенными характеристиками: первая - длинные последовательности схожей длины (около 1267а.к); вторая - средние последовательности схожей длины (около 424а.к); третья - последовательности с огромной разницей в длине (5488 и 9а.к). На всей длине они совершенно точно негомологичны. Локально тоже, т.к в первых двух случаях и низкий процент совпадения и очень много гэпов. А третья пара (большой и маленький белок) прекрасно иллюстрирует, что важно учитывать длину анализируемых последовательностей. Очевидно, что на 5 тысячах аминокислот статистически найдется участок, похожий на значительную часть белка длиной 9а.к, что и видно в последней строке таблицы. Последовательности, конечно, негомологичны
Файл с выравниванием
Мнемоника: ACP (нашлось 533 записи)
Рекомендованное полное имя: Acyl carrier protein
Выбранные белки: ACP_ECOLI; ACP_BACSU; ACP_CERSP; ACP_LEUMU; ACP_RHIME; ACP_OCELI; ACP_PSESM
Выравнивание делалось с помощью Jalview, белки загружались из UniProt
Комментарии: все белки гомологичны и хорошо выровнялись. Два консервативных участка: 7-11 и 32-51, остальные менее консервативны, но с проблеском позиций, одинаковых у всех семи последовательностей. Но в целом, как я уже сказал, все последовательности очень похожи
На этом все