Оптимальное парное выравнивание


Задание 1

Для задания выбраны белки: шаперон DnaK Methanosarcina maze (P0CW13) и шаперон DnaK Yersinia pseudotuberculosis serotype I (Q66ET0).

Глобальное выравнивание, сделанное с помощью программы needle пакета EMBOSS, раскрашенное ClustalX с параметром Identity Threshold = 100%.

Параметры выравнивания, полученные infoalign, представлены в таблице 1.

Таблица 1.
Имя последовательности Длина последовательности Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позиции (от всех позиции) Схожие позиции (от всех позиций)
P0CW13|DNAK_METMA 619 646 4 27 365 (56.5%) 481 (74.5%)
Q66ET0|DNAK_YERPS 636 646 4 8 365 (56.5%) 481 (74.5%)


Локальное выравнивание, сделанное с помощью программы water пакета EMBOSS, раскрашенное ClustalX с параметром Identity Threshold = 100%.

Параметры выравнивания, полученные infoalign, представлены в таблице 2.

Таблица 2.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позиции (от всех позиций) Схожие позиции (от всех позиций)
P0CW13|DNAK_METMA 617 644 4 27 365 (56.7%) 481 (78.0%)
Q66ET0|DNAK_YERPS 636 644 4 8 365 (56.7%) 481 (74.7%)


Параметры needle и water, используемые по умолчанию, представлены в таблице 3.

Таблица 3.
Программа Матрица весов Штраф за открытие гэпа (неконцевого) Штраф за удлинения гэпа (неконцевого) Штраф за открытие концевого гэпа Штраф за удлинение концевого гэпа
needle EBLOSUM62 10.0 0.5 10.0 0.5
water EBLOSUM62 10.0 0.5 - -


Глобальное выравнивание длиннее локального, количество гэпов и их длина совпадают. Количество идентичных и схожих остатков одинакого, так как в локальное выравнивание не вошла лишь небольшая и несхожая часть белков. Совпадения в параметрах выравниваний вызваны большой схожестью белков.

Задание 2

Белки, выбранные для задания, - гликозид гидролаза Bacillus licheniformis (Q65MI2), рибонуклеаза TTHA0252 Thermus thermophilus (Q5SLP1), мальтогенная амилаза Thermus sp. (O69007), 4-альфа-глюкантрансфераза DPE1 Arabidopsis thaliana (Q9LV91), изомераза сахарозы Erwinia rhapontici (D9MPF2), фосфоглюконолактоназа Thermotoga maritima (Q9X0N8).

Локальные выравнивания пяти пар негомологичных последовательностей, сделанные с помощью программы water пакета EMBOSS, раскрашенное ClustalX с параметром Identity Threshold = 100%.

Параметры выравниваний, полученные infoalign, представлены в таблицах 4,5,6,7,8.

Таблица 4.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позициии (от всех позиций) Сходные позиций (от всех позиций)
Q65MI2_BACLD 26 27 1 1 10 (37.0%) 17 (63.0%)
RNSE_THET8 27 27 0 0 10 (37.0%) 17 (63.0%)

Таблица 5.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позициии (от всех позиций) Сходные позиций (от всех позиций)
Q65MI2_BACLD 549 589 8 40 137 (23.3%) 235 (39.9%)
O69007_9DEIN 453 589 19 136 137 (23.3%) 235 (39.9%)

Таблица 6.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позициии (от всех позиций) Сходные позиций (от всех позиций)
Q65MI2_BACLD 551 559 5 8 248 (44.4%) 356 (63.7%)
D9MPF2_ERWRD 552 559 3 7 248 (44.4%) 356 (63.7%)

Таблица 7.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позициии (от всех позиций) Сходные позиций (от всех позиций)
Q65MI2_BACLD 419 465 9 46 88 (18.9%) 151 (32.5%)
DPE_ARATH 384 465 18 81 88 (18.9%) 151 (32.5%)

Таблица 8.
Имя последовательности Длина последовательности в выравнивании Длина выравнивания Количество гэпов Длина гэпов Абсолютно консервативные позициии (от всех позиций) Сходные позиций (от всех позиций)
Q65MI2_BACLD 216 254 8 38 50 (19.7%) 88 (34.6%)
6PGL_THEMA 206 254 8 48 50 (19.7%) 88 (34.6%)


Из представленных таблиц ясно, что выравнивания негомологичных последовательностей имеют меньше абсолютно консервативных и функционально схожих позиций и больше гэпов.


Задание 3

Локальное и глобальное выравнивания:

Различия:


Локальное и вырезанное из множенственного выравнивания:

Различия:


Глобальное и вырезанное из множественного выравнивания:

Различия:


Я считаю, что локальное выравнивание показало наиболее достоверные результаты в приведённых выше примерах, но ,возможно, для других целей и пар последовательностей глобальное могло бы подойти лучше. Использование вырезанного из множественного выравнивания представляется мне нерациональным.


© Сурикова Елена 2016