На страницу II-ого семестра

Сравнение фрагмента полного множественного выравнивания, полученного с помощью программы ClustalW, с соответствующим фрагментом "эталонного" выравнивания из SMART

  1. Получения эталонного выравнивания из SMART

    В базе данных SMART получили изображение доменной структуры белка BIOB_Ecoli. Выбрали домен Eps3 и получили эталонное выравнивание доменов, гомологичных нашему.

    Из эталонного выравнивания вырезали фрагмент длинной 63 а.о. и шириной 5 последовательностей:

                                                                                                                                                                       
                                                *                 2 0                   *                 4 0                   *                 6 0                  
    M O A A _ B A C S U   :   R V T I S L D S L E D E R F K K I N G R G V S V S K V L E G I E A A K Q A G - - L G V K I N M V V - Q K G V N E K D I L P M A R   :   6 1
    B I O B _ Y E A S T   :   A Y N H N I D T S R E H Y S K - - V I T T R T Y D D R L Q T I K N V Q E S G - - I K A C T G G I L G L G - E S E D D H I G F I Y   :   5 9
    H E M N _ B R A J A   :   R A S L G V Q S F D P I V Q R A - I N R I Q S F E Q T A A V V D M L R H A G - I A G I N F D L I Y G L P H Q T V A S C L D T V R   :   6 2
    Y Q E V _ B A C S U   :   H L H I P I Q S G S N T V L K R - M R R K Y T M E F F A D R L N K L K K A L P G L A V T S D V I V G F P G E T E E E F M E T Y N   :   6 3
    H E M N _ A Q U A E   :   R I S L G V Q D L D P K V Q Q A - V N R V Q P Y E L I K E K M E K L R E A G - F E S I N L D L I Y G L P Y Q T K E S F E K T V E   :   6 2
                                        6                           r                     6           a g                   6   g                                      


  2. Множественное выравнивание, построенное в ClustalW.

    Для построения множественного выравнивания сначала получили полные аминокислотные последовательности с помощью SRS, которые сохранили в файле full_seq.fasta . Множественное выравнивание этих 5-ти последовательностей строили с помощьб программы ClustalW (emma из пакета EMBOSS). После этого полученный файл выравнивания импортировали в GenDoc. Строки нашего множественного выравнивания, соответствующие строкам эталонного выравнивания раскрасили фиолетовым цветом.

                                                                                                                                                                                                                                                                 
                                                *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                   *               1 0 0                            
    M O A A _ B A C S U   :   R V T I S L D S L E D E R F K K I N G R G V S V S K V L E G I E A A K Q A G L G V K I N M V V Q K G V N E K D I L P M A R Y F K E K G H I L R F I E F M D V G N T N Q W E K K D V M T K A E I I D L I N K H M P V E P I   :   1 0 8
    B I O B _ Y E A S T   :   K R N G S T R F C L G A A W R D M K G R K S A M K R I Q E M V T K V N D M G L E T C V T L G M V D Q D Q A K Q L K D A G L T A Y N H N I D T S R E H Y S K V I T T R T Y D D R L Q T I K N V Q E S G I K A C T G G I L G   :   1 0 8
    H E M N _ B R A J A   :   N R A S L G V Q S F D P I V Q R A I N R I Q S F E Q T A A V V D M L R H A G I A G I N F D L I Y G L P H Q T V A S C L D T V R R S L L L A P D R F S V F G Y A H V P D F K K H Q R M I N Q G A L P D G P A R H D Q A C A   :   1 0 8
    Y Q E V _ B A C S U   :   F C I I P W A R G L L R S R D P E E V I K Q A Q Q L V D A G Y K E I V L T G I H T G G Y G E D M K D Y N F A K L L S E L D T R V E G V K R I R I S S I E A S Q I T D E V I E V L D R S D K I V N H L H I P I Q S G S N T   :   1 0 8
    H E M N _ A Q U A E   :   N R I S L G V Q D L D P K V Q Q A V N R V Q P Y E L I K E K M E K L R E A G F E S I N L D L I Y G L P Y Q T K E S F E K T V E K V I E L N P D R I A T Y S F A Y I P Q V K P H Q Q L L P K E A L P S A E E K L R I F E M   :   1 0 8
                                                                    r                                   G                                                                                                                                                        
                                                                                                                                               
                                *               1 2 0                   *               1 4 0                   *                              
    M O A A _ B A C S U   :   A P N Y I G E V A S R F R Y L D G S G E I G - - V I S S V S D A F C G S C N R A R L S A R G E L F T C   :   1 5 7
    B I O B _ Y E A S T   :   L G E S E D D H I G F I Y T L S N M S P H P E S L P I N R L V A I K G T P M A E E L A D P K S K K L Q   :   1 5 9
    H E M N _ B R A J A   :   I A N A L K E A G Y V Q I G L D H F A R P D D S M A V A F E E R T L R R N F Q G Y T T D Q G E V L L G   :   1 5 9
    Y Q E V _ B A C S U   :   V L K R M R R K Y T M E F F A D R L N K L K K A L P G L A V T S D V I V G F P G E T E E E F M E T Y N   :   1 5 9
    H E M N _ A Q U A E   :   V I N K F Q E A G Y V Y I G M D H F A K P E D E L A V A Q R K G E L W R N F Q G Y T T K K G V E L L G   :   1 5 9
                                                            d                 6                                                                

    Итак, сравним эталонное выравнивание и наше множественное выравнивание.

    Во множественном выравнивании из файла clustalw.msf есть только две последовательности (HEMN_BRAJA и HEMN_AQUAE), для которых колонки из эталонного выравнивания совпали с нашим выравниванием, причем совпали 62 из 64 колонок, отсутствуют 2 колонки с гэпами. Следует также заметить, что совпавшие последовательности принадлежат по-видимому ортологам (здесь было несколько нарушено условие задания, что надо выбирать последовательности с идентификаторами различающие как по первой части, так и по второй части имени, но это было продиктовано качеством эталонного выравнивания.) Программа ClustalW, так построила множественное выравнивание, что "строки эталонного выравнивания" оказались сдвинуты друг относительно друга. Из всего выше сказанного можно сделать вывод, что эталонное выравнивание и выравнивание из ClustalW различаются очень сильно.

    Из того, что ClustalW построил выравнивание, так сильно отличающиеся от эталонного, не следует делать вывод, что это плохая программа. Очевидно, такое выравнивание продиктовано объективными причинами, связанными с особенностями алгоритма ClustalW.

  3. Матрицы попарного выравнивания.

    Матрица эталонного фрагмента выравнивания.

                  MOAA_BACSU   BIOB_YEAST   HEMN_BRAJA   YQEV_BACSU   HEMN_AQUAE 
    
      MOAA_BACSU          100%                                                    
    
      BIOB_YEAST           11%         100%                                       
    
      HEMN_BRAJA           14%           6%         100%                          
    
      YQEV_BACSU           17%          11%          22%         100%             
    
      HEMN_AQUAE           11%          11%          53%          23%         100%
    	

    Матрица фрагмента выравнивания, построенного в Clustal.

                                                                     
                   MOAA_BACSU   BIOB_YEAST   HEMN_BRAJA   YQEV_BACSU   HEMN_AQUAE 
    
      MOAA_BACSU          100%                                                    
    
      BIOB_YEAST            9%         100%                                       
    
      HEMN_BRAJA            8%           6%         100%                          
    
      YQEV_BACSU            7%           8%           6%         100%             
    
      HEMN_AQUAE            8%           7%          47%          10%         100%
    	

    Из матриц попарного сходства видно, что эталонное выравнивание несколько лучше, чем наше выравнивание.

    Вообщем, по каким-то не до конца понятным причинам ClustalW построил не очень удачное выравнивание наших последовательностей:(


© Sedliarov Vitaliy