Возврат на главную страницу второго семестра

Глобальное и локальное выравнивания аминокислотных последовательностей

Матрицы переходов

Глобальное выравнивание

  • Матрица переходов строилась для последовательностей MVLG (первые 4 аминокислотных остатков белка CRP_ECOLI) и MTWLS (полученной из первой двумя произвольными заменами и вставкой одной аминокислоты);
  • При построении матрицы использовались следующие параметры:

    • цена совпадения аминокислот 2;
    • цена замены -1;
    • цена делеции -2;
  • Вес оптимального пути равен 0;
Оптимальное глобальное выравнивание:
X  M-VLG
   |  |    
Y  MTWLS        
Нулевой вес выравнивания означает, что вероятность того, что выравнивание биологически осмыслено, равна вероятности его случайного получения. Это может быть вызвано тем, что на очень небольшом участке мы произвели много действий — замены и вставку.

Локальное выравнивание

  • Матрица переходов строилась для последовательностей MVLGKPQTD (первые 9 аминокислотных остатка белка CRP_ECOLI) и VLQTD;
  • При построении матрицы использовались следующие параметры:

    • цена совпадения аминокислот 2;
    • цена замены -1;
    • цена делеции -2;
  • Вес оптимального пути 6;
  • Вес субоптимального пути 4;
Оптимальное локальное выравнивание:
X  QTD
   |||
Y  QTD    
Субоптимальное локальное выравнивание:
X  VL
   ||
Y  VL    
Локальное выравнивание, как следует из матрицы переходов, может начинаться со второй аминокислоты последовательности X и состоять из двух аминокислот, а может начинаться с седьмой и продолжаться до конца. Первое выравнивание прерывается, как только вес выравнивания начинает падать. Слева приведены два локальных выравнивания, отвечающих матрице переходов.

Влияние параметров на глобальное выравнивание

При построении глобального выравнивания программа NEEDLE из програмного пакета EMBOSS учитывает аффинную систему штрафов за открытие и продолжение делеций в выравниваемых последовательностях. Аффинная система штрафов подразумевает то, что за открытие гэпа и за его продолжение накладывается разный штраф.Это обосновано, так как более вероятно, что произойдет одна крупная делеция, чем несколько мелких в одном участке. Полученное с учетом такой системы штрафов выравнивание будет иметь больший биологический смысл.

Приведенное ниже выравнивание, построенное программой NEEDLE при стандартном параметре цены открытия и цене продолжения гэпа равной 1, отражает тот случай, когда нежелательны и очень длинные, и мелкие единичные делеции. Мы видим внутри выравнивания только одну — длиной в две аминокислоты. Абсолютно аналогичную картину можно увидеть при штрафе за открытие гэпа равном 5 и штрафе за продолжение равном 1.

Выравнивание строилось со следующими параметрами:

  • Штраф за открытие делеции — 10;
  • Штраф за продолжение делеции — 1.
CRP_ECOLI          1 MVLGKPQTDPTLEWFLSHCHIHKYPSKSTLIHQGEKAETLYYIVKGSVAV     50
                                                                       
NEWSEQ             1                                                         0

CRP_ECOLI         51 LIKDEEGKEMILSYLNQGDFIGELGLFEEGQERSAWVRAKTACEVAEISY    100
                                                                       
NEWSEQ             1                                                         0

CRP_ECOLI        101 KKFRQLIQVNPDILMRLSAQMARRLQVTSEKVGNLAFLDVTGRIAQTLLN    150
                                                                   ||..
NEWSEQ             1                                               TLYY      4

CRP_ECOLI        151 LAKQPDAMTHPDGMQIKITRQEIGQIVGCSRETVGRILKMLEDQNLISAH    200
                     :.|  .::.|||||||||                                
NEWSEQ             5 IVK--GSVAHPDGMQIKI                                     20

CRP_ECOLI        201 GKTIVVYGTR    210
                               
NEWSEQ            21                20

Следующее выравнивание содержит большее число совпадений аминокислот. В нем система штафа за гэп сделана простой, т.е. открытие и продолжение делеции оценивается одинаково и при этом штраф гораздо меньше, чем в предыдущем выравнивании. При этом программа увеличивает число гэпов внутри последовательности, чтобы увеличить число совпадений аминокислот.

CRP_ECOLI          1 MVLGKPQTDPTLEWFLSHCHIHKYPSKSTLIHQGEKAETLYYIVKGSVAV     50
                                                           ||||||||||| 
NEWSEQ             1                                       TLYYIVKGSVA-     11

CRP_ECOLI         51 LIK-DEEGKEM-I-LSYLNQGDFIGELGLFEEGQERSAWVRAKTACEVAE     97
                       . |  |  | | :                                   
NEWSEQ            12 --HPD--G--MQIKI                                        20

CRP_ECOLI         98 ISYKKFRQLIQVNPDILMRLSAQMARRLQVTSEKVGNLAFLDVTGRIAQT    147
                                                                       
NEWSEQ            21                                                        20

CRP_ECOLI        148 LLNLAKQPDAMTHPDGMQIKITRQEIGQIVGCSRETVGRILKMLEDQNLI    197
                                                                       
NEWSEQ            21                                                        20

CRP_ECOLI        198 SAHGKTIVVYGTR    210
                                  
NEWSEQ            21                   20

Выравнивание строилось со следующими параметрами:

  • Штраф за открытие делеции — 1;
  • Штраф за продолжение делеции — 1.

Сравнивая полученные выравнивания, можно заметить, что ни одно из них не оказалось объективным. Последовательность NEWSEQ получалась склеиванием двух небольших участков последовательности, а не вырезанием из нее мелких фрагментов с образованием небольших и многочисленных делеций; но первое выравнивание все равно нашло только один реально гомологичный участок, а все остальные совпадения аминокислот случайны.

Очевидно, дело в том, что штраф за продолжение гэпа слишком велик. Его нужно сделать еще меньше, чтобы программа построила выравнивание, отвечающее рельно проделанным с последовательностью преобразованиям.


© Dibrova Dasha aka UdavDasha, 2005