protein name | ID 1 | ID 2 | score | % identity | % similarity | gaps | indels |
---|---|---|---|---|---|---|---|
Malate dehydrogenase | MDH_ECOLI | MDH_BACSU | 285.5 | 29.6% | 49.7% | 52 | 20 |
L-cystine transport system ATP-binding protein TcyN* | TCYN_ECOLI | TCYN_BACSU | 621.0 | 48.9% | 67.4% | 19 | 5 |
Phosphoglycerate kinase | PGK_ECOLI | PGK_BACSU | 908.0 | 47.4% | 66.7% | 17 | 7 |
protein name | ID 1 | ID 2 | score | % identity | % similarity | gaps | indels | coverage 1 | coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Malate dehydrogenase | MDH_ECOLI | MDH_BACSU | 292.5 | 31.2% | 52.1% | 36 | 17 | 95.8% | 95.8% |
L-cystine transport system ATP-binding protein TcyN* | TCYN_ECOLI | TCYN_BACSU | 624.5 | 52.7% | 72.0% | 3 | 2 | 97.2% | 92.7% |
Phosphoglycerate kinase | PGK_ECOLI | PGK_BACSU | 908.0 | 48.1% | 67.5% | 14 | 6 | 97.9% | 98.7% |
Проведем выравнивание таких неродственных друг другу белков как HELD_BACSU (DNA helicase IV) и RSPA_ECOLI (Starvation-sensing protein RspA)
alignment | ID 1 | ID 2 | score | % identity | % similarity | gaps | indels | coverage 1 | coverage 2 |
---|---|---|---|---|---|---|---|---|---|
global | RSPA_ECOLI | HELD_BACSU | 26.0 | 9.4% | 17.9% | 592 | 33 | ||
local | RSPA_ECOLI | HELD_BACSU | 59.0 | 17.8% | 31.2% | 143 | 19 | 62.4% | 36.1% |
Схожесть белков в глобальном выравнивании меньше 25%, из чего можно сделать вывод, что схожесть случайна. Об этом также говорит сильно большое количество гэпов, в локальном выравнивании - небольшой процент покрытия.
В Swiss-Prot нашлось 538 белков, чьи идентификаторы начинаются с мнемоники MDH (Malate dehydrogenase). Выбраны (помимо MDH_ECOLI и MDH_BACSU):
MDH_THETH (Thermus thermophilus)
MDH_TOBAC (Nicotiana tabacum)
MDH_YERPE (Yersinia pestis)
MDH_VIBVY (Vibrio vulnificus)
MDH_BORA1 (Bordetella avium)
Множественное выравнивание было создано в Jalview.
Кажется, малатдегидрогеназа является достаточно консервативным белком. Последовательности выровнялись хорошо, гэпов не очень много (есть лишь порядка 7 участков, на которых произошла инсерция (или делеция) длиной более 2: 1-5, 35-38, 46-50, 73-76, 147-149, 207-215, 228-230. Эти индели являются относительно короткими, самый большой - 207-215. Видимо, произошла инсерция в последовательности белка Nicotiana tabacum; это объяснимо тем, что все остальные организмы - бактерии, последовательности их белков будут более схожи между собой, чем с последовательностью эукариота.
Самые консервативные участки: 8-21, 99-108, 138-146, все они расположены в первой половине последовательности. Из выше сказанного можно сделать вывод, что последовательности являются гомологичными.