Глобальное и локальное выравнивание аминокислотных последовательностей


на главную

Матрицы переходов

Глобальное выравнивание

  • Последовательности:
    MLDA, MIEHA
  • параметры, использовавшиеся при построении матрицы:
    вес совпадения = 2, вес замены = -1, штраф за делецию = -2
  • картинка с матрицей переходов:
       M L D A
      0 -2 -4 -6 -8
    M -2 Õ 2 Ñ 0 Ñ -2 Ñ -4
    I -4 Ó 0 Õ 1 Ñ -1 Ñ -3
    E -6 Ó -2 Ó -1 Õ 0 Ñ -2
    H -8 Ó -4 Õ -3 Ó -2 Õ -1
    A -10 Ó -6 Ó -5 Õ -4 Õ 0
  • выравнивание, соответствующие оптимальному пути:
    MLD-A
    MIEHA
  • вес оптимального пути: 0

Локальное выравнивание

  • Последовательности:
    MLDAQTIAT, LDIAT
  • параметры, использовавшиеся при построении матрицы:
    вес совпадения = 2, вес замены = -1, штраф за делецию = -2
  • картинка с матрицей переходов:
        M L D A Q T I A T
      0 0 0 0 0 0 0 0 0 0
    L 0 0 Õ 2 0 0 0 0 0 0 0
    D 0 0 0 Õ 4 Ñ 2 0 0 0 0 0
    I 0 0 0 Ó2 Õ 3 Ñ 1 0 Õ 2 0 0
    A 0 0 0 0 Õ 4 Ñ 2 0 0 Õ 4 Ñ 2
    T 0 0 0 0 Ó 2 Õ 3 Õ 4 Ñ 2 Ó2 Õ 6
  • выравнивание, соответствующие оптимальному пути:
    IAT
    IAT
  • вес оптимального пути: 6
  • выравнивание, соответствующие субоптимальному пути:
    LD-AQT
    LDIA-T
  • вес субоптимального пути: 4

Влияние параметров на глобальное выравнивание

параметрывыравнивания
  • Матрица аминокислотных замен: EBLOSUM62
  • Штраф за открытие делеции: 1.0
  • Штраф за продолжение делеции: 1.0
HMP_ECOLI          1 MLDAQTIATVKATI---PLLVETGPKLTAHFYDRMFTHNPELKEIFNMSN     47
                     ||||||||||||::   |   : | |  .  | |                
mutant             1 MLDAQTIATVKASLTRKP---D-G-K--G--Y-R                     24

HMP_ECOLI         48 QRNGDQREALFNAIAAYASNIENLPALLPAVEKIAQKHTSFQIKPEQYNI     97
                                                                       
mutant            25                                                        24

HMP_ECOLI         98 VGEHLLATLDEMFSPGQEVLDAWGKAYGVLANVFINREAEIYNENASKAG    147
                                                                       
mutant            25                                                        24

HMP_ECOLI        148 GWEGTRDFRIVAKTPRSALITSFELEPVDGGAVAEYRPGQYLGVWLKPEG    197
                                                                       
mutant            25                                                        24

HMP_ECOLI        198 FPHQEIRQYSLTRKPDGKGYRIAVKREEGGQVSNWLHNHANVGDVVKLVA    247
                                                                       
mutant            25                                                        24

HMP_ECOLI        248 PAGDFFMAVADDTPVTLISAGVGQTPMLAMLDTLAKAGHTAQVNWFHAAE    297
                                                                       
mutant            25                                                        24

HMP_ECOLI        298 NGDVHAFADEVKELGQSLPRFTAHTWYRQPSEADRAKGQFDSEGLMDLSK    347
                                                                       
mutant            25                                                        24

HMP_ECOLI        348 LEGAFSDPTMQFYLCGPVGFMQFTAKQLVDLGVKQENIHYECFGPHKVL    396
                                                                      
mutant            25                                                       24
  • Матрица аминокислотных замен: EBLOSUM62
  • Штраф за открытие делеции: 10.0
  • Штраф за продолжение делеции: 1.0
HMP_ECOLI          1 MLDAQTIATVKATIPLLVETGPKLTAHFYDRMFTHNPELKEIFNMSNQRN     50
                                                                       
mutant             1                                                         0

HMP_ECOLI         51 GDQREALFNAIAAYASNIENLPALLPAVEKIAQKHTSFQIKPEQYNIVGE    100
                                                                       
mutant             1                                                         0

HMP_ECOLI        101 HLLATLDEMFSPGQEVLDAWGKAYGVLANVFINREAEIYNENASKAGGWE    150
                                                                       
mutant             1                                                         0

HMP_ECOLI        151 GTRDFRIVAKTPRSALITSFELEPVDGGAVAEYRPGQYLGVWLKPEGFPH    200
                                                                   ....
mutant             1                                               MLDA      4

HMP_ECOLI        201 QEIR--QYSLTRKPDGKGYRIAVKREEGGQVSNWLHNHANVGDVVKLVAP    248
                     |.|.  :.||||||||||||                              
mutant             5 QTIATVKASLTRKPDGKGYR                                   24

HMP_ECOLI        249 AGDFFMAVADDTPVTLISAGVGQTPMLAMLDTLAKAGHTAQVNWFHAAEN    298
                                                                       
mutant            25                                                        24

HMP_ECOLI        299 GDVHAFADEVKELGQSLPRFTAHTWYRQPSEADRAKGQFDSEGLMDLSKL    348
                                                                       
mutant            25                                                        24

HMP_ECOLI        349 EGAFSDPTMQFYLCGPVGFMQFTAKQLVDLGVKQENIHYECFGPHKVL    396
                                                                     
mutant            25                                                      24

По алгоритму программа needle пытается найти выравнивание с наибольшим количеством очков. Большее количество очков возможно в следующих случаях: один из кусочков сопоставляется с аналогичным в исходном или оба кусочка выравниваются с белком, причем между ними вставляются гэпы. Рассмоттрим данные выравнивания.
В первом случае (штраф за открытие делеции: 1.0) видно, что первый кусочек выровнялся с аналогичным в исходной последовательности (это дает определенное количество очков). Далее программа обильно вставляет гэпы, чтобы набрать как можно больше очков за совпадения и родственные замены(в этом случае программе выгоднее наставить делеции, т.к. за нее штраф меньше, чем за любую неродственную замену).
Во втором случае (штраф за открытие делеции: 10.0) картина изменилась. Теперь второму кусочку сопоставляется его истинное положение в белке. Первый участок выравнивается с неродственным участком. Число гэпов заметно снизилось. Это опять объясняется поиском наибольшего веса (програме не выгодно вставлять делеции, и она предпочитает замены).
Почему же программа не выровняла эти два кусочка с их истинным положением в белке? Если бы они были на небольшом расстоянии, то, возможно, они бы и могли быть сопоставленны при таких штрафах.




© Тихонов Максим, 2005