Дерево моего сайта

Глобальное и локальное выравнивание аминокислотных последовательностей


Моя страничка состоит из трёх частей

Матрицы переходов глобального и локального выравнивания Поиск участков локальной гомологии Влияние параметров на глобальное выравнивание

В процесе обучения мы использовали из пакета программ EMBOSS следущие:
  • needle
  • water
  • matcher

  • Матрица переходов

    Для построения глобальной матрицы выравнивания использовались:
    Cледующие последовательности:
    Последовательность №1: AEEKQ
    Последовательность №2: EEK
    Последовательность №1               1 AEEKQ      5
                                           ||| 
    Последовательность №2               1  EEK       3
    
    Cледующие параметры:
  • Цена за делецию: -2
  • Цена замены: -1
  • Цена совпадения: 2

  • Матрица глобального выравнивания:



    Вес оптимального пути выравнивания = 2



    Для построения локальной матрицы выравнивания использовались:
    Cледующие последовательности:
    Последовательность №1:NELTWHDVL
    Последовательность №2:ELDVL

    Результаты локального выравнивания при использовании программы matcher:
                          Оптимальный путь      Субоптимальный путь
                            выравнивания           выравнивания
    Последовательность №1     2  EL 3                 7 DVL 9
                                 ||                     |||
    Последовательность №2     1  EL 2                 3 DVL 5

    Cледующие параметры:
  • Цена за делецию: -2
  • Цена замены: -1
  • Цена совпадения: 2


  • Матрица локального выравнивания:


    Вес оптимального пути выравнивания = 6
    Вес субоптимального пути выравнивания = 4



    Поиск участков локальной гомологии

    Эта часть посвящена анализу результатов, полученных с помощью программы построения локального выравнивания matcher

  • 1-Последовательность белка из Esherichia Coli-P12295 (Урацил-ДНК гликозилаза)

    MANELTWHDVLAEEKQQPYFLNTLQTVASERQSGVTIYPPQKDV FNAFRFTELGDVKVVILGQDPYHGPGQAHGLAFSVRPGIAIPPSLLNMYKELENTIPG FTRPNHGYLESWARQGVLLLNTVLTVRAGQAHSHASLGWETFTDKVISLINQHREGVV FLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGCNHFVLANQWLEQRGETPI DWMPVLPAESE

  • 2-исскуственно созданная последовательность издвух небольших участков моего белка:
    WHDVLAEEKQQRGETPIDWM



    Координаты участков последовательности моего белка из которого была составлена третья последовательность
  • Первый участок: 7 - 18
  •                  
                     UNG_EC  7 WHDVLAEEKQQ 18
                               :::::::::::
      Последовательность №3  1 WHDVLAEEKQQ 11
                                                     
    
  • Второй участок: 213 - 221
  •            
                  UNG_ECOLI     213  RGETPIDWM     221
                                     |||||||||
      Последовательность №3      12  RGETPIDWM     20
    
    


    Влияние параметров на глобальное выравнивание

    параметры по которым выравнивания были построены выравнивания между последоавтельность№1 и последовательность№3:
    Матрица по котрой строилось выравнивание Штраф за открытие делеции Штраф за продолжение делеции

    Длина

    Сходство

    Score:

    EBLOSUM62

    10

    1

    229

    14/229 ( 6.1%)

    64.0

    EBLOSUM62

    1

    1

    231

    15/231 ( 6.5%)

    76.0

    EBLOSUM80

    1

    1

    229

    17/229 ( 7.4%)

    129.0

    EBLOSUM40

    1

    1

    229

    17/229 ( 7.4%)

    120.0

    При изменении штрафа за открытие делеции меняеться само выравнивание.Так при уменьшениии штрафа за открытие делеции, получаеться что при таких гепах выгодней наплевать на совпадения лишь бы был меньше штраф. В результате Score здесь наибольший => сходство с белком хорошее, но много ГЕПов => это банальное совпадение аминокислот, но не пеетидов.
        При штрафе в 10
    
    UNG_ECOLI   151 LINQHREGVVFLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGC 200
                                                                           
    3 посл.       1                                                    0
    
    UNG_ECOLI   201 NHFVLANQWLEQRGETPIDWMPVLPAESE    229
                    .|.|||.: .:||||||||||        
    3 посл.       1 WHDVLAEE-KQQRGETPIDWM             20
    
        При штрафе в 1
    
    UNG_ECOLI   151 LINQHREGVVFLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGC 200
                                                                   :  
    3 посл.       1                                                W-- 1
    
    UNG_ECOLI   201 NHFVLANQWLE--QRGETPIDWMPVLPAESE    229
                     |.||| :  |  ||||||||||        
    3 посл.       2 -HDVLA-E--EKQQRGETPIDWM             20
         
    Когда мы меняем матрицы замен EBLOSUM. У нас получаеться различные результаты т.к в разных матрицах различные отношения к ГЕПам. Например в некоторых просто идёт поиск наилудшего результата несмотря на огромное число ГЕПов, при одинаковой стоимости делеции.

    Матрица EBLOSUM62
    UNG_ECOLI   151 LINQHREGVVFLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGC 200
                                                                   :  
    3 посл.       1                                                W-- 1
    
    UNG_ECOLI   201 NHFVLANQWLE--QRGETPIDWMPVLPAESE    229
                     |.||| :  |  ||||||||||        
    3 посл.       2 -HDVLA-E--EKQQRGETPIDWM             20
    

    Матрица EBLOSUM80
    UNG_ECOLI   151 LINQHREGVVFLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGC 200
                                 |  |        |     || | .      .:     
    3 посл.       1              W--H--------D-----VL-A-E------EK----- 9
    
    UNG_ECOLI   201 NHFVLANQWLEQRGETPIDWMPVLPAESE    229
                           |   ||||||||||        
    3 посл.      10 -------Q---QRGETPIDWM             20
    

    Матрица EBLOSUM40
    UNG_ECOLI   151 LINQHREGVVFLLWGSHAQKKGAIIDKQRHHVLKAPHPSPLSAHRGFFGC 200
                                 |  |        |     || |      . .:     
    3 посл.       1              W--H--------D-----VL-A------E-EK----- 9
    
    UNG_ECOLI   201 NHFVLANQWLEQRGETPIDWMPVLPAESE 229
                           |   ||||||||||        
    3 посл.      10 -------Q---QRGETPIDWM         20
    
    Различия выравнивания видны сразу. В первом случае штраф за отрытие делеции высок, а программа стремится к максимальной цене выравнивания, поэтому почти нет гепов. Во втором случае штрав за делецию существенно ниже, поэтому мы видим на выравнивании довольно большое количество гэпов. Матрицы аминокислотных замен также влияют на выравнивание. При разных параметрах матриц (EBLOSUM80, EBLOSUM62, EBLOSUM40), которые задают разные эволюционные расстояния, получаются отличия в выравнивании, при задании матрицы EBLOSUM62 меньше гэпов, чем при задании матрицы EBLOSUM80, так как программа при использовании EBLOSUM80 старается добиться максимального сходства даже при большом количестве гэпов. Для матрицы ЕBLOSUM80 последовательности сходны не более чем на 80% процентов, для EBLOSUM62 - не более чем на 60% и для EBLOSUM40 не более чем на 40%.

    На главную