Оптимальное парное выравнивание. Алгоритмы.

1.Сравнение параметров выравнивания
Сравнение параметров локального и глобального выравний проводилось на примере белков теплового шока семейства HSP70, для которых выполнялоь выравнивание в предыдущем практикуме. Была выбрана пара белков Chaperone protein DnaK (Mycobacterium leprae) и Heat shock protein homolog SSE1 (Candida glabrata). В пакете EMBOSS предусмотрены специальные команды для разных типов выравниваний. Так, команда "needle" получает на вход две последовательности, а затем выдаёт файл с оптимальным глобальным выравниванием пары. При этом используется алгоритм Нилдмана-Вунша. В качестве дополнительного аргумета можно выбрать различные матрицы выравнивания (например, BLOSUM62 для белковых последовательностей или EDNAFULL для нуклеотидных последовательностей), а также указать величину "штрафа" за открытие гэпа (gapopen) и за продолжение гэпа (gapextend ). Команда "water" используется для локального парного выравнивания. При этом, штраф за открытие гэпа составляет по умолчанию 10.0, а за его удлинение - 0.5. Матрица весов - EBLOSUMS62 для белков.

Таблица 1. Сравнение 2x типов выравниваний.
ID Длина выравнивания Длина последовательности Абсолютно консервативные позиции Процент Число гэпов Процент
Локальное выравнивание (water)
DNAK_MYCLE 703 597 176 29,5% 15 2,5%
HSP7F_CANGA 703 675 176 26,1% 9 1,3
Глобальное выравнивание (needle)
DNAK_MYCLE 729 620 181 29,2% 16 2,6%
HSP7F_CANGA 729 694 181 26,1% 10 1,4%

Из таблицы 1 видно, что локальное и глобальное выравнивания одних и тех же последовательностей отличаются по ряду основных параметров: число гэпов, число абсолютно идентиных позиций и т.д. Главное их отличие состоит в длине (что вполне логично). Число абсолютно консервативных позиций (как и их процент) больше в глобальном выравнивании, глобальное выравнивание лидирует и по числу гэпов, так как в локальном выравнивании установлены большие штрафы за открытие и удлиннение гэпов.
Подтверждающие иллюстрации:

Глобальное выравнивание двух гомологичных последовательностей (окончание)
Локальное выравнивание двух гомологичных последовательностей (окончание)
2. Сравнение параметров локального выравнивания пары гомологов и пяти пар не гомологов
ID Длина выравнивания Абсолютно консервативные позиции Процент Число гэпов Процент
Глобальные выравнивания моего белка с негомологичными (needle)
ANW70673.1 + AMW32606.1 254 20 7,87% 3 1,18%
ANW70673.1 + KST73838.1 308 28 9% 5; 4 1,6%; 1,3%
ANW70673.1 + AKJ93252.1 575 16 2,8% 1; 3 0,17%; 0,52%
ANW70673.1 + AKC71559.1 527 23 4,4% 4; 2 0,76%; 0,38%
ANW70673.1 + BAC68787.1 630 20 3,2% 1; 5 1,6%; 0,79%
Локальные выравнивания моего белка с негомологичными (water)
ANW70673.1 + AMW32606.1 20 7 35% 0; 1 0%; 5%
ANW70673.1 + KST73838.1 28 9 32% 1; 0 3,6%; 0
ANW70673.1 + AKJ93252.1 24 7 29% 0; 1 0%; 4,2%
ANW70673.1 + AKC71559.1 21 8 38% 1; 0 4,8%; 0
ANW70673.1 + BAC68787.1 79 18 22,9% 0; 5 0%; 6,3%

Проанализировав полученную таблицу и выравнивания, можно сказать о том, что длина локального выравнивания для двух негомологичных последовательностей гораздо меньше чем длина глобального, а также часто меньше, чем длина самих последовательностей (например, длина глобального выравнивания составляет 527 аминокислотных остатков, а длина локального - 21). Cредние значения показателей в процентах для всех пяти негомологичных пар мой белок + белок однокурсника примерно одинаковы. Так, процент абсолютно консервативных позиций составляет от 22 до 35 процентов, тогда как в глобальных выравниваниях соостветствующий показатель не выше 8%. Количество (и длина) гэпов в локальном выравнивании также меньше.
Из этого можно сделать вывод: имеет смысл выравнивать негомологичные последовательности только с помощью команды для локального выравнивания water, в этом случае в выравнивании могут найтись похожие домены, или аминокислотные мотивы, имеющие какой-то биологический смысл.
Выравнивания:
1. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + AMW32606.1

(1)

(2)
2. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + KST73838.1

(1)

(2)
3. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + AKJ93252.1

(1)

(2)

И так далее.
Ссылка проект JalView c выравниваниями из 1го и 2го заданий
3. Отличия между выравниваниями в разных программах
Это задание я выполняла на примере белков теплового шока Q12WE6 и Q01100 из предидущего практикума. Первое выравнивание - множественное, с другими белками этого семейства. Второе - парное глобальное (needle) в третье - парное локальное. В целом можно сказать что, выравнивания отличаются не очень сильно. Обсудим отличия:

(1) Множественное выравнивание гомологичных белков, из которого удалены все, кроме пары

(2) Глобальное выравнивание пары белков

(3)Локальное выравнивание пары белков
1. Последний аминокислотный остаток в глобальном выравнивании: Е сопоставлено Е, а в локальном и множественом - К сопоставлена Е.
2. Если рассматривать колонкy А-G, аналогичную во всех выравниваниях, то после неё во множественном выравнивании стоит гэп напротив A (позиция 697), в глобальном выравнивании S напротив A (595), в локальном - S напротив A (590).
3.Снова обратимся к концу выравнивания. Здесь в глобальном выравнивании после консервативного V-V идёт E-D, а потом E-E (позиции 627-629), рассматривая эту же область в локальном выравнивании можно отметить, что после консервативного V-V идёт два гэпа напротив Е подряд (позиции 631-633), если речь идёт о множетсвенном выравнивании, то здесь вообще нет консервативного V-V, вместо него идёт три гэпа подряд напротив VEE (позиции 733-735).
Глобальное и множетственное выравнивания похожи между собой, локальное от них отличается сильнее. Сссылка на проект с выравниваниями 3го задания
Источники:
1.en.wikipedia.org/wiki/Chaperone
2.kodomo.fbb.msu.ru/wiki/2016/2/pr11

Назад