Оптимальное парное выравнивание. Алгоритмы.
1.Сравнение параметров выравнивания
Сравнение параметров локального и глобального выравний проводилось на примере белков теплового шока семейства HSP70, для которых выполнялоь выравнивание в предыдущем практикуме.
Была выбрана пара белков Chaperone protein DnaK (Mycobacterium leprae) и Heat shock protein homolog SSE1 (Candida glabrata).
В пакете EMBOSS предусмотрены специальные команды для разных типов выравниваний. Так, команда "needle" получает на вход две последовательности, а затем выдаёт файл с оптимальным глобальным выравниванием пары.
При этом используется алгоритм Нилдмана-Вунша. В качестве дополнительного аргумета можно выбрать различные матрицы выравнивания (например, BLOSUM62 для белковых последовательностей или EDNAFULL для нуклеотидных последовательностей), а также указать величину "штрафа" за открытие гэпа (gapopen) и за
продолжение гэпа (gapextend ). Команда "water" используется для локального парного выравнивания.
При этом, штраф за открытие гэпа составляет по умолчанию 10.0, а за его удлинение - 0.5. Матрица весов - EBLOSUMS62 для белков.
Таблица 1. Сравнение 2x типов выравниваний.
ID |
Длина выравнивания |
Длина последовательности |
Абсолютно консервативные позиции |
Процент |
Число гэпов |
Процент |
Локальное выравнивание (water) |
DNAK_MYCLE |
703 |
597 |
176 |
29,5% |
15 |
2,5% |
HSP7F_CANGA |
703 |
675 |
176 |
26,1% |
9 |
1,3 |
Глобальное выравнивание (needle) |
DNAK_MYCLE |
729 |
620 |
181 |
29,2% |
16 |
2,6% |
HSP7F_CANGA |
729 |
694 |
181 |
26,1% |
10 |
1,4% |
Из таблицы 1 видно, что локальное и глобальное выравнивания одних и тех же последовательностей отличаются по ряду основных параметров: число
гэпов, число абсолютно идентиных позиций и т.д. Главное их отличие состоит в длине (что вполне логично). Число абсолютно консервативных позиций (как и их процент)
больше в глобальном выравнивании, глобальное выравнивание лидирует и по числу гэпов, так как в локальном выравнивании установлены большие штрафы за открытие и удлиннение гэпов.
Подтверждающие иллюстрации:
Глобальное выравнивание двух гомологичных последовательностей (окончание)
Локальное выравнивание двух гомологичных последовательностей (окончание)
2. Сравнение параметров локального выравнивания пары гомологов и пяти пар не гомологов
ID |
Длина выравнивания |
Абсолютно консервативные позиции |
Процент |
Число гэпов |
Процент |
Глобальные выравнивания моего белка с негомологичными (needle) |
ANW70673.1 + AMW32606.1 |
254 |
20 |
7,87% |
3 |
1,18% |
ANW70673.1 + KST73838.1 |
308 |
28 |
9% |
5; 4 |
1,6%; 1,3% |
ANW70673.1 + AKJ93252.1 |
575 |
16 |
2,8% |
1; 3 |
0,17%; 0,52% |
ANW70673.1 + AKC71559.1 |
527 |
23 |
4,4% |
4; 2 |
0,76%; 0,38% |
ANW70673.1 + BAC68787.1 |
630 |
20 |
3,2% |
1; 5 |
1,6%; 0,79% |
Локальные выравнивания моего белка с негомологичными (water) |
ANW70673.1 + AMW32606.1 |
20 |
7 |
35% |
0; 1 |
0%; 5% |
ANW70673.1 + KST73838.1 |
28 |
9 |
32% |
1; 0 |
3,6%; 0 |
ANW70673.1 + AKJ93252.1 |
24 |
7 |
29% |
0; 1 |
0%; 4,2% |
ANW70673.1 + AKC71559.1 |
21 |
8 |
38% |
1; 0 |
4,8%; 0 |
ANW70673.1 + BAC68787.1 |
79 |
18 |
22,9% |
0; 5 |
0%; 6,3% |
Проанализировав полученную таблицу и выравнивания, можно сказать о том, что длина локального выравнивания для двух негомологичных
последовательностей гораздо меньше чем длина глобального, а также часто меньше, чем длина самих последовательностей (например, длина глобального
выравнивания составляет 527 аминокислотных остатков, а длина локального - 21). Cредние значения показателей в процентах для всех пяти
негомологичных пар мой белок + белок однокурсника примерно одинаковы. Так, процент абсолютно консервативных позиций составляет от 22 до 35 процентов,
тогда как в глобальных выравниваниях соостветствующий показатель не выше 8%. Количество (и длина) гэпов в локальном выравнивании также меньше.
Из этого можно сделать вывод: имеет смысл выравнивать негомологичные последовательности только с помощью команды для локального выравнивания
water, в этом случае в выравнивании могут найтись похожие домены, или аминокислотные мотивы, имеющие какой-то биологический смысл.
Выравнивания:
1. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + AMW32606.1
(1) (2)
2. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + KST73838.1
(1) (2)
3. Глобальное (1) и локальное (2) выравнивания ANW70673.1 + AKJ93252.1
(1) (2) И так далее.
Ссылка проект JalView c выравниваниями из 1го и 2го заданий
3. Отличия между выравниваниями в разных программах
Это задание я выполняла на примере белков теплового шока Q12WE6 и Q01100 из предидущего практикума. Первое выравнивание - множественное, с другими белками этого
семейства. Второе - парное глобальное (needle) в третье - парное локальное. В целом можно сказать что, выравнивания отличаются не очень сильно. Обсудим отличия:
(1) Множественное выравнивание гомологичных белков, из которого удалены все, кроме пары (2) Глобальное выравнивание пары белков (3)Локальное выравнивание пары белков
1. Последний аминокислотный остаток в глобальном выравнивании: Е сопоставлено Е, а в локальном и множественом - К сопоставлена Е.
2. Если рассматривать колонкy А-G, аналогичную во всех выравниваниях, то после неё во множественном выравнивании стоит гэп напротив A (позиция 697), в глобальном выравнивании S напротив A (595), в локальном - S напротив A (590).
3.Снова обратимся к концу выравнивания. Здесь в глобальном выравнивании после консервативного V-V идёт E-D, а потом E-E (позиции 627-629), рассматривая эту же область в локальном выравнивании
можно отметить, что после консервативного V-V идёт два гэпа напротив Е подряд (позиции 631-633), если речь идёт о множетсвенном выравнивании, то здесь вообще нет консервативного V-V, вместо него идёт три гэпа подряд напротив VEE (позиции 733-735).
Глобальное и множетственное выравнивания похожи между собой, локальное от них отличается сильнее.
Сссылка на проект с выравниваниями 3го задания
Источники:
1.en.wikipedia.org/wiki/Chaperone
2.kodomo.fbb.msu.ru/wiki/2016/2/pr11
|