Оптимальное парное выравнивание. Алгоритмы

Практикум 11

Задание 1.

1. Выравнивание двух гомологичных последовательностей

По умолчанию программы используют для белков матрицу EBLOSUM62, которая задается атрибутом -datafile
Штраф за открытие инделя - 10.0. В needle задается атрибутом -endopen, в water -gapopen
Штраф за удлинение инделя - 0.5. В needle задается атрибутом -endextend, в water -gapextend
Штраф за последний гэп по умолчанию отсутствует. В needle задается атрибутом -endweight

В отличие от программы needle, ориентированной на выравнивание последовательностей от первого до последнего знака, water выравнивает отдельные наиболее похожие участки последовательностей, вследствие чего могут быть потеряны некоторые буквы. В результате получившиеся выравнивания различаются между собой.


Сравнение основных параметров консервативности выравниваний, построенных в программах needle и water:

программа длина выравнивания консервативные функционально консервативные позиции с гэпами число инделей
число процент число процент
needle 677 327 48.30% 414 61,15% 37 31
water 671 324 48.29% 414 61,70%  31 28


Water:



Needle:


Задание 2. Сравните параметры локального выравнивания пары гомологичных белков и пяти пар не гомологичных белков

При выравниваниии негомологичных последовательностей обнаружилось значительно меньшее количество консервативных позиций.

Характеристики выравниваний негомологичных последовательностей:

идентификатор белка длина выравнивания консервативные функционально консервативные позиции с гэпами
число процент число процент
A0A0X8D5E1 177 34 19,21% 49 27,68% 6
E8YVR4 169 22 13,02% 39 23,08% 3
A0A109QDP9 220 35 15,91% 57 25,91% 6
A0A1B0VIM1 224 23 10,27% 40 17,86% 5
A0A0B5QAX8 228 32 14,04% 48 21,05% 7

Заметно большее количество консервативных позиций в последнем выравнивании(гомологичных последовательностей):



Сравнение выравниваний, построенных разными программами

Первые две последовательности вырезаны из множественного выравнивания. Третья и четвертая выравнены с помощью программы needle, пятая и шестая - water.

Выравнивания water и needle с параметрами по умолчанию различаются исключительно тем, что water удалил 10 концевых позиций из первой последовательности.
Парное выравнивание, полученное из множественного, совпадает с needle и water до 77 позиции. Далее, в первой последовательности второго и третьего выравнивания - длинный индель. В результате SER с позиции 77 смещен на позицию 86 и выровнен с SER из второй последовательности. То же самое происходит со стоящей сразу за ним ASN.
В первом выравнивании между TRP, стоящей на позиции 79, и ASN (78) нет гэпа, и TRP находится над PHE второй последовательности. В needle и water между TRP (92) и ASN (87) стоит индель, и ASN находится над ASN второй последовательности.
В первом выравнивании в первой последовательности ASN и стоящий за ней GLY смещены на 111 и 112 позиции соответственно, и стоят над GLN и SER второй последовательности. В выравниях water и needle они стоят на 98 и 99 позициях над идентичными аминокислотами второй последовательности.

Первое выравнивание дает, на мой взгляд, более достоверную информацию, так как было построено с учетом положения соответсвующих аминокислот в других последовательностях. Чем больше последовательностей соответствуют выравниванию, тем больше вероятность действительной гомологии аминокислот.




Назад
© Петрова Юлия 2016