Выравнивание последовательностей


Глобальное парное выравнивание гомологичных белков


Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
* - L-cystine import ATP-binding protein TcyN для TCYN_BACSU
protein name ID 1 ID 2 score % identity % similarity gaps indels
Malate dehydrogenase MDH_ECOLI MDH_BACSU 285.5 29.6% 49.7% 52 20
L-cystine transport system ATP-binding protein TcyN* TCYN_ECOLI TCYN_BACSU 621.0 48.9% 67.4% 19 5
Phosphoglycerate kinase PGK_ECOLI PGK_BACSU 908.0 47.4% 66.7% 17 7

Локальное парное выравнивание гомологичных белков


Таблица 2. Характеристики локального парного выравнивания трёх пар белков
* - L-cystine import ATP-binding protein TcyN для TCYN_BACSU
protein name ID 1 ID 2 score % identity % similarity gaps indels coverage 1 coverage 2
Malate dehydrogenase MDH_ECOLI MDH_BACSU 292.5 31.2% 52.1% 36 17 95.8% 95.8%
L-cystine transport system ATP-binding protein TcyN* TCYN_ECOLI TCYN_BACSU 624.5 52.7% 72.0% 3 2 97.2% 92.7%
Phosphoglycerate kinase PGK_ECOLI PGK_BACSU 908.0 48.1% 67.5% 14 6 97.9% 98.7%

Результат применения программ выравнивания к неродственным белкам


Проведем выравнивание таких неродственных друг другу белков как HELD_BACSU (DNA helicase IV) и RSPA_ECOLI (Starvation-sensing protein RspA)

Таблица 3. Характеристики глобального и локального парного выравнивания пары негомологичных белков
alignment ID 1 ID 2 score % identity % similarity gaps indels coverage 1 coverage 2
global RSPA_ECOLI HELD_BACSU 26.0 9.4% 17.9% 592 33
local RSPA_ECOLI HELD_BACSU 59.0 17.8% 31.2% 143 19 62.4% 36.1%

Схожесть белков в глобальном выравнивании меньше 25%, из чего можно сделать вывод, что схожесть случайна. Об этом также говорит сильно большое количество гэпов, в локальном выравнивании - небольшой процент покрытия.


Множественное выравнивание белков и импорт в Jalview


В Swiss-Prot нашлось 538 белков, чьи идентификаторы начинаются с мнемоники MDH (Malate dehydrogenase). Выбраны (помимо MDH_ECOLI и MDH_BACSU):

MDH_THETH (Thermus thermophilus)
MDH_TOBAC (Nicotiana tabacum)
MDH_YERPE (Yersinia pestis)
MDH_VIBVY (Vibrio vulnificus)
MDH_BORA1 (Bordetella avium)

Множественное выравнивание было создано в Jalview.
Кажется, малатдегидрогеназа является достаточно консервативным белком. Последовательности выровнялись хорошо, гэпов не очень много (есть лишь порядка 7 участков, на которых произошла инсерция (или делеция) длиной более 2: 1-5, 35-38, 46-50, 73-76, 147-149, 207-215, 228-230. Эти индели являются относительно короткими, самый большой - 207-215. Видимо, произошла инсерция в последовательности белка Nicotiana tabacum; это объяснимо тем, что все остальные организмы - бактерии, последовательности их белков будут более схожи между собой, чем с последовательностью эукариота.

Самые консервативные участки: 8-21, 99-108, 138-146, все они расположены в первой половине последовательности. Из выше сказанного можно сделать вывод, что последовательности являются гомологичными.

проект Jalview