Практикум 9

Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Fructose-bisphosphate aldolase class 2 ALF_ECOLI ALF_BACSU 279.0 25.3% 41.0% 98 16
UDP-glucose 4-epimerase GALE_ECOLI GALE_BACSU 1032.0 56.8% 70.6% 3 2
DNA repair protein RecO RECO_ECOLI RECO_BACSU 137.5 22.1% 37.4% 81 18
Названия белков приведены для кишечной палочки. Для сенной палочки рекомендованное имя для белка ALF_BACSU - Probable fructose-bisphosphate aldolase, для остальных имена совпадают с именами для кишечной палочки.

Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Fructose-bisphosphate aldolase class 2 ALF_ECOLI ALF_BACSU 289.0 27.5% 43.2% 78 12 88.0% 89.1%
UDP-glucose 4-epimerase GALE_ECOLI GALE_BACSU 1033.0 57.4% 71.4% 1 1 99.4% 98.8%
DNA repair protein RecO RECO_ECOLI RECO_BACSU 42.0 22.3% 36.5% 64 10 53.7% 40.0%

Комментарии к выравниваниям

ALF_ECOLI и ALF_BACSU
Процент идентичности этих белков достаточно высокий - 25.3% и 27.5% в глобальном и локальном выравнивании соответственно, что говорит об их гомологичности. В локальном выравнивании, по сравнению с глобальным меньше гэпов и инделей, а также выше общий вес, процент идентичности и сходства, хотя разница относительно небольшая (10 баллов веса, 2.2% для идентичности и сходства). Таким образом, локальное выравнивание информативнее глобального, но не сильно. Это говорит о том, что белки гомологичны по всей длине.

GALE_ECOLI и GALE_BACSU
Процент идентичности этих белков очень высокий - 56.8% и 57.4% в глобальном и локальном выравнивании соответственно, что говорит об их гомологичности. В локальном выравнивании, по сравнению с глобальным меньше гэпов и инделей, а также выше общий вес, процент идентичности и сходства, хотя разница относительно небольшая (1 балл веса, 1.4% для идентичности и 0.8% для сходства). Таким образом, локальное выравнивание информативнее глобального, но не сильно. Это говорит о том, что белки гомологичны по всей длине.

RECO_ECOLI и RECO_BACSU
Процент идентичности этих белков достаточно высокий - 22.1% и 22.3% в глобальном и локальном выравнивании соответственно, что говорит об их гомологичности. В локальном выравнивании, по сравнению с глобальным меньше гэпов и инделей, а также выше процент идентичности, но при этом ниже общий вес и процент сходства. Причем разница процентов идентичности и сходства всё ещё маленькая (0.2% и 0.9% соответственно), а разница веса довольно большая - 95.5 баллов. Таким образом, в данном случае глобальное выравнивание информативнее локального. Это говорит о том, что белки гомологичны по всей длине.

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Глобальное и локальное выравнивания для неродственных белков

Выравнивание ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Глобальное (needle) ALF_ECOLI GALE_BACSU 51.0 13.9 23.7 240 18 - -
Локальное (water) ALF_ECOLI GALE_BACSU 58.0 18.6 31.4 128 16 81.9% 81.4%

Можно увидеть, что в обоих выравниваниях получиося маленький вес, а также низкий процент идентичности и схожести, и это говорит о том, что белки не гомологичны. При этом процент перекрытия высокий, но, поскольку вес, проценты идентичсности и сходства маленькие, это можно объяснить схожей структурой или химическим составом белков, возможно из-за схожих функций или случайности.

Множественное выравнивание белков и импорт в Jalview

Мнемоника белка: RECO
Полное название: DNA repair protein RecO
Количество результатов в Swiss-Prot: 491
Выбранные белки: RECO_BIFAA, RECO_MYCTA, RECO_OENOB, RECO_SALPA, RECO_STRPI

Выравнивание сделано в Jalview с "Muscle with Defaults"

Ссылка на файл с проектом Jalview

Данные белки выравнялись достаточно хорошо. При этом участков с высоким процентом идентичности довольно мало, а аминокислоты со средним процентом идентичности относительно равномерно распределены по длинам белков. Это говорит о гомологичности этих белков.
Наиболее консервативный участки: 11-21, 32-46, 142-260
Наименее консервативные участки: 56-69, 104-123, 187-206, 215-241