Практикум 9

Выравнивания

Задание 1

Табл. 1. Характеристики глобального парного выравнивания трех пар белков
Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
DNA polymerase III subunit alpha DPO3A_ECOLI DPO3A_BACSU 1913,5 37,7% 56,4% 85 24
1,4-alpha-glucan branching enzyme GlgB GLGB_ECOLI GLGB_BACSU 1367,0 35,9% 51,1% 145 11
Mannitol-specific cryptic phosphotransferase enzyme IIA component* PTMA_ECOLI PTMA_BACSU 128,0 22,7% 49,3% 10 6
*«Mannitol-specific phosphotransferase enzyme IIA component» для B. subtilis

Задание 2

Табл. 2. Характеристики локального парного выравнивания трех пар белков
Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
DNA polymerase III subunit alpha DPO3A_ECOLI DPO3A_BACSU 1922,5 37,8% 56,8% 78 23 99,4% 99,6%
1,4-alpha-glucan branching enzyme GlgB GLGB_ECOLI GLGB_BACSU 1377,5 43,2% 61,2% 22 7 83,7% 95,9%
Mannitol-specific cryptic phosphotransferase enzyme IIA component PTMA_ECOLI PTMA_BACSU 134,0 24,5% 53,2% 6 4 93,2% 94,4%

Задание 3

Табл. 3. Характеристики выравниваний неродственных белков
Alignment ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Global DPO3A_ECOLI GLGB_BACSU 32,0 7,4% 12,7% 1079 37
Local DPO3A_ECOLI GLGB_BACSU 55,0 21,8% 35,7% 82 18 18,7% 32,7%

Ожидаемо, вес выравнивания и процент идентичных и похожих аминокислот для негомологичных белков оказались низкими. Доля скожих аминокислот в 36% для локального выравнивания кажется не такой маленькой, покрытие последовательностей очень мало в сравнении с осмысленными выравниваниями, поэтому это число говорит только о некоторой схожести фрагментов этих белков (вероятнее всего, случайной). Бросается в глаза огромное количество гэпов в глобальном выравнивании.

Задание 4

Множественное выравнивание строил для ДНК-полимеразы (DNA polymerase III subunit alpha, мнемоника DPO3A). В SwissProt нашлось 64 белка с такой мнемоникой. Выбрал пять белков из достаточно известных бактерий (DPO3A_YERPE, DPO3A_HELPJ, DPO3A_STAAM, DPO3A_THEAQ, DPO3A_VIBCH). Выравнивание сделал программой muscle на kodomo. Проект Jalview находится здесь. Вроде бы, все белки нормально выровнялись (было бы странно, если бы у бактерий оказались негомологичны ДНК-полимеразы). Наименее консервативен С-конец белка, примерно с 1060 позиции до конца. Самый большой консервативный блок находится примерно на 420–540 позициях, но их довольно много на всем выравнивании, кроме C-конца.