Сравнение выравниваний, полученных для коротких мутантов (см. страничку про парное выравнивание белков, где описаны данные мутанты) вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

В табл. 1 представлен результат сравнения трех выравниваний (вручную, needle, water) по similarity и identity.
Мутант 1 Мутант 2 Мутант 3
Вручную Needle Water Вручную Needle Water Вручную Needle Water
Identity, % 30 35 35 50 50 50 70 70 70
Similarity, % 40 60 60 60 55 64,3 70 70 70
Вес выравнивания -1 20,5 20,5 36 30 35 54 48 49

Табл 1. Результат сравнения выравниваний.

Выравнивания water:

	                
	Мутант 1. 
	# Identity:       7/20 (35.0%)
    # Similarity:    12/20 (60.0%)
    # Gaps:           2/20 (10.0%)
    # Score: 20.5
    # 
    #
    #=======================================
    
    generations=1      1 GGKNSHLELFPVSFRQHSPN     20
                         |.||..|::..::  |.:||
    SEQUENCE          56 GVKNHLLDMSLLN--QLAPN     73
    
    Мутант 2.
	# Identity:       7/14 (50.0%)
    # Similarity:     9/14 (64.3%)
    # Gaps:           0/14 ( 0.0%)
    # Score: 35.0
    # 
    #
    #=======================================
    
    generations=1      5 IQFSGSAFSHTCIL     18
                         :.|||...|.||:|
    SEQUENCE           8 VVFSGGQDSTTCLL     21
    
	Мутант 3.
	# Identity:      14/20 (70.0%)
    # Similarity:    14/20 (70.0%)
    # Gaps:           1/20 ( 5.0%)
    # Score: 49.0
    # 
    #
    #=======================================
    
    generations=1      1 NHLY-MSELNQDAAAALTRN     19
                         |||. ||.|||.|..|||||
    SEQUENCE          59 NHLLDMSLLNQLAPNALTRN     78
	

Выравнивания needle:

	Мутант 1.
	# Identity:       7/221 ( 3.2%)
# Similarity:    12/221 ( 5.4%)
# Gaps:         203/221 (91.9%)
# Score: 20.5
# 
#
#=======================================

generations=1      0 --------------------------------------------------      0
                                                                       
SEQUENCE           1 MKKEKAIVVFSGGQDSTTCLLWALKEFEEVETVTFHYNQRHSQEVEVAKS     50

generations=1      1 -----GGKNSHLELFPVSFRQHSPN-------------------------     20
                          |.||..|::..::  |.:||                         
SEQUENCE          51 IAEKLGVKNHLLDMSLLN--QLAPNALTRNDIEIEVKDGELPSTFVPGRN     98

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE          99 LVFLSFASILAYQIGARHIITGVCETDFSGYPDCRDEFVKSCNVTVNLAM    148

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE         149 EKPFVIHTPLMWLNKAETWKLADELGALDFVKNNTLTCYNGIIADGCGEC    198

generations=1     20 ---------------------     20
                                          
SEQUENCE         199 PACHLRSKGYEEYMVMKGERA    219
    
	Мутант 2.
	# Identity:      10/219 ( 4.6%)
# Similarity:    11/219 ( 5.0%)
# Gaps:         199/219 (90.9%)
# Score: 30.0
# 
#
#=======================================

generations=1      1 --GNKAI-QFSGSAFSHTCILLL---------------------------     20
                       ..||| .|||...|.||:|..                           
SEQUENCE           1 MKKEKAIVVFSGGQDSTTCLLWALKEFEEVETVTFHYNQRHSQEVEVAKS     50

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE          51 IAEKLGVKNHLLDMSLLNQLAPNALTRNDIEIEVKDGELPSTFVPGRNLV    100

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE         101 FLSFASILAYQIGARHIITGVCETDFSGYPDCRDEFVKSCNVTVNLAMEK    150

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE         151 PFVIHTPLMWLNKAETWKLADELGALDFVKNNTLTCYNGIIADGCGECPA    200

generations=1     20 -------------------     20
                                        
SEQUENCE         201 CHLRSKGYEEYMVMKGERA    219

   Мутант 2.
   # Identity:      14/219 ( 6.4%)
# Similarity:    14/219 ( 6.4%)
# Gaps:         199/219 (90.9%)
# Score: 48.0
# 
#
#=======================================

generations=1      0 --------------------------------------------------      0
                                                                       
SEQUENCE           1 MKKEKAIVVFSGGQDSTTCLLWALKEFEEVETVTFHYNQRHSQEVEVAKS     50

generations=1      1 --------NHLY-MSELNQDAAAALTRNG---------------------     20
                             |||. ||.|||.|..|||||.                     
SEQUENCE          51 IAEKLGVKNHLLDMSLLNQLAPNALTRNDIEIEVKDGELPSTFVPGRNLV    100

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE         101 FLSFASILAYQIGARHIITGVCETDFSGYPDCRDEFVKSCNVTVNLAMEK    150

generations=1     20 --------------------------------------------------     20
                                                                       
SEQUENCE         151 PFVIHTPLMWLNKAETWKLADELGALDFVKNNTLTCYNGIIADGCGECPA    200

generations=1     20 -------------------     20
                                        
SEQUENCE         201 CHLRSKGYEEYMVMKGERA    219
    

Отличие результатов выравниваний по алгоритму и руками объясняется недостаточно хорошим качеством ручного выравнивания. Отличие друг от друга результатов выравниваний по алгоритмам (у второго мутанта) объясняется разными принципами действия (за все первые гэпы water поставил нули, тем самым сократив последовательнось мутанта до 14 a.о. В третьем случае отличие весов выравнивания, скорее всего, объясняется разными парамерами по умолчанию (штраф за гэп и др.) алгоритмов.

Алгоритмы Нидлмана-Вунша и Смита-Ватермана выполняются соответственно программмами needle и water. Needle - это глобальное выравнивание и нацелено на лучшего выравнивания последователь6ностей целиком. Water - локальное выравнивание и нацелено на поиск схожих частей двух последовательностей и их выравнивание.

Параметры по умолчанию needle: штаф за начало гэпа - 10, штраф за продолжение - 0.5, матрица весов замен - BLOSUM62. У water эти параметры те же.


© Ляпунов Александр, 2012.       Дата последнего изменения: