| |
Оптимальное глобальное выравнивание:
X M-VLG | | Y MTWLS |
Нулевой вес выравнивания означает, что вероятность того, что выравнивание биологически осмыслено, равна вероятности его случайного получения. Это может быть вызвано тем, что на очень небольшом участке мы произвели много действий замены и вставку. |
|
|||
|
Локальное выравнивание, как следует из матрицы переходов, может начинаться со второй аминокислоты последовательности X и состоять из двух аминокислот, а может начинаться с седьмой и продолжаться до конца. Первое выравнивание прерывается, как только вес выравнивания начинает падать. Слева приведены два локальных выравнивания, отвечающих матрице переходов. |
При построении глобального выравнивания программа NEEDLE из програмного пакета EMBOSS учитывает аффинную систему штрафов за открытие и продолжение делеций в выравниваемых последовательностях. Аффинная система штрафов подразумевает то, что за открытие гэпа и за его продолжение накладывается разный штраф.Это обосновано, так как более вероятно, что произойдет одна крупная делеция, чем несколько мелких в одном участке. Полученное с учетом такой системы штрафов выравнивание будет иметь больший биологический смысл.
Приведенное ниже выравнивание, построенное программой NEEDLE при стандартном параметре цены открытия и цене продолжения гэпа равной 1, отражает тот случай, когда нежелательны и очень длинные, и мелкие единичные делеции. Мы видим внутри выравнивания только одну длиной в две аминокислоты. Абсолютно аналогичную картину можно увидеть при штрафе за открытие гэпа равном 5 и штрафе за продолжение равном 1.
Выравнивание строилось со следующими параметрами:
|
CRP_ECOLI 1 MVLGKPQTDPTLEWFLSHCHIHKYPSKSTLIHQGEKAETLYYIVKGSVAV 50 NEWSEQ 1 0 CRP_ECOLI 51 LIKDEEGKEMILSYLNQGDFIGELGLFEEGQERSAWVRAKTACEVAEISY 100 NEWSEQ 1 0 CRP_ECOLI 101 KKFRQLIQVNPDILMRLSAQMARRLQVTSEKVGNLAFLDVTGRIAQTLLN 150 ||.. NEWSEQ 1 TLYY 4 CRP_ECOLI 151 LAKQPDAMTHPDGMQIKITRQEIGQIVGCSRETVGRILKMLEDQNLISAH 200 :.| .::.||||||||| NEWSEQ 5 IVK--GSVAHPDGMQIKI 20 CRP_ECOLI 201 GKTIVVYGTR 210 NEWSEQ 21 20 |
Следующее выравнивание содержит большее число совпадений аминокислот. В нем система штафа за гэп сделана простой, т.е. открытие и продолжение делеции оценивается одинаково и при этом штраф гораздо меньше, чем в предыдущем выравнивании. При этом программа увеличивает число гэпов внутри последовательности, чтобы увеличить число совпадений аминокислот.
CRP_ECOLI 1 MVLGKPQTDPTLEWFLSHCHIHKYPSKSTLIHQGEKAETLYYIVKGSVAV 50 ||||||||||| NEWSEQ 1 TLYYIVKGSVA- 11 CRP_ECOLI 51 LIK-DEEGKEM-I-LSYLNQGDFIGELGLFEEGQERSAWVRAKTACEVAE 97 . | | | | : NEWSEQ 12 --HPD--G--MQIKI 20 CRP_ECOLI 98 ISYKKFRQLIQVNPDILMRLSAQMARRLQVTSEKVGNLAFLDVTGRIAQT 147 NEWSEQ 21 20 CRP_ECOLI 148 LLNLAKQPDAMTHPDGMQIKITRQEIGQIVGCSRETVGRILKMLEDQNLI 197 NEWSEQ 21 20 CRP_ECOLI 198 SAHGKTIVVYGTR 210 NEWSEQ 21 20 |
Выравнивание строилось со следующими параметрами:
|
Сравнивая полученные выравнивания, можно заметить, что ни одно из них не оказалось объективным. Последовательность NEWSEQ получалась склеиванием двух небольших участков последовательности, а не вырезанием из нее мелких фрагментов с образованием небольших и многочисленных делеций; но первое выравнивание все равно нашло только один реально гомологичный участок, а все остальные совпадения аминокислот случайны.
Очевидно, дело в том, что штраф за продолжение гэпа слишком велик. Его нужно сделать еще меньше, чтобы программа построила выравнивание, отвечающее рельно проделанным с последовательностью преобразованиям.