Сравнение фрагмента полного множественного выравнивания, полученного с помощью программы ClustalW, с соответствующим фрагментом "эталонного" выравнивания из SMART

На главную страницу второго семестра
Фрагмент эталонного выравнивания из SMART
                                                                                                                                                                                   
                                            *                 2 0                   *                 4 0                   *                 6 0                   *              
D E O D _ E C O L I   :   G M L G F T G T Y K G R K I S V M G H G M G I P S C S I Y T K E L I T D F G V K K I I R V G S C G A V L P H V K L R D V V I G M G A C T D S K V   :   7 2
D E O D _ L A C L C   :   G M L G F T G T Y K G H R V S V M G T G M G I P S I S I Y A N E L I T E Y G V K R L I R V G T A G S V N E D V H I R D L V I G Q A A A T T S A I   :   7 2
D E O D _ B A C S U   :   G M Y G F T G T Y K G K K I S V Q G T G M G V P S I S I Y V N E L I Q S Y D V Q N L I R V G S C G A I R K D V K V R D V I L A M T S S T D S Q M   :   7 2
M T N N _ H A E I N   :   S A V I F E G K I N G K D V A L L Q S G I G K V A A A I G T T A L L Q L A K P D C V I N T G S A G G V A K G L K V G D I V I S D E T R Y H D A D   :   7 2
M T N N _ T R E P A   :   G L T F Y V V S V G A L Q V V Y V C G G V G K V N A A L C T Q L L I S E F G A R V L I N T G I A G A L D E R L C V F D V L V S V D A V Q H D V D   :   7 2
                                                                G   G                     L                   I     G     G                   D                                    
Матрица попарной идентичности

Выравнивание, построенное ClustalW
(Цветом выделены участки, присутствующие в эталонном выравнивании)
                                                                                                                                                                                             
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                        
D E O D _ E C O L I   :   - A T P H I N A E M G D F A D V V L M P G D P L R A K Y I A E T F L E D A R E V N N V R G M L G F T G T Y K G R K I S V M G H G M G I P S C S I Y T K E   :     7 5
D E O D _ L A C L C   :   M P T P H I E A Q K G E I A D K I L L P G D P L R A K F I A E N F L E D A V Q F N Q V R G M L G F T G T Y K G H R V S V M G T G M G I P S I S I Y A N E   :     7 6
D E O D _ B A C S U   :   - M S V H I G A E K G Q I A D T V L L P G D P L R A K F I A E T Y L E N V E C Y N E V R G M Y G F T G T Y K G K K I S V Q G T G M G V P S I S I Y V N E   :     7 5
M T N N _ H A E I N   :   M K I G I V G A M A Q E V E I L K N L M A D R T E T R V A S A V I F E G K I N G K D V A L L Q S G I G K V A A A I G T T A L L Q L A K P D C V I N T G S   :     7 6
M T N N _ T R E P A   :   M T V G V F A A L G E E V A R V R E C L G G - V G T E R A G L T F Y V V S V G A L Q V V Y V C G G V G K V N A A L C T Q L L I S E F G A R V L I N T G I   :     7 5
                                        A                                                                     V     6         G               3                         I                    
                                                                                                                                                                                             
                              8 0                   *               1 0 0                   *               1 2 0                   *               1 4 0                   *                
D E O D _ E C O L I   :   L I T D F G V K K I I R V G S C G A V L P H V K L R D V V I G M G A C T D S K V N R I R F K D H D F A A I A D F D M V R N A V D A A K A L G - - - - - -   :   1 4 5
D E O D _ L A C L C   :   L I T E Y G V K R L I R V G T A G S V N E D V H I R D L V I G Q A A A T T S A I V R H D F P D F D F P Q I A D F D L L D K A Y H I A K D L G - - - - - -   :   1 4 6
D E O D _ B A C S U   :   L I Q S Y D V Q N L I R V G S C G A I R K D V K V R D V I L A M T S S T D S Q M N R V A F G S V D F A P C A D F E L L K N A Y D A A K D K G - - - - - -   :   1 4 5
M T N N _ H A E I N   :   A G G V A K G L K V G D I V I S D E T R Y H D A D V T A F G Y E K G Q L P - - - - - - - - A N P A A F L S D K K L A D L A Q E I A E K Q G - - - - - - -   :   1 3 7
M T N N _ T R E P A   :   A G A L D E R L C V F D V L V S V D A V Q H D V D V T A F G Y Q K G R I P R M D S V E W T A N T A L R Y L V R E A F D L C T R D P E W T E G A C A L S G   :   1 5 1
                                            6     6                                                                                                                                          
                                                                                                                                                                                             
                                    1 6 0                   *               1 8 0                   *               2 0 0                   *               2 2 0                            
D E O D _ E C O L I   :   - - - - - - - - I D A R V G N L F S A D L F Y S P D G E M F D V M E K Y G - I L G V E M E A A G I Y G V A A E F G A K A L T I C T V S D H I R T H E Q T   :   2 1 2
D E O D _ L A C L C   :   - - - - - - - - I T T H V G N I L S S D L F Y G G P D - - A V K V G K L G - V K A V E M E A A G L Y Y L G A K Y K V Q T L G I M T I S D H I L T G E S T   :   2 1 1
D E O D _ B A C S U   :   - - - - - - - - V P V T V G S V F T A D Q F Y N D D S - Q I E K L A K Y G - V L G V E M E T T A L Y T L A A K H G R K A L S I L T V S D H V L T G E E T   :   2 1 1
M T N N _ H A E I N   :   - - - - - - - - Q S V K R G L I C S G D S F I N S E D K I A Q I K A D F P N V T G V E M E A T A I A Q V C Y A F N V P F V V V R A I S D G G - - D G K A   :   2 0 3
M T N N _ T R E P A   :   S G D P P S R V S R L V E G R V A S G D L F V S D A Q T R A R I I R E F G - A H G V E M E G A A F A H V A S V N G V P F V I I R C I S D G A G A E Q D V   :   2 2 6
                                                    G   6   3   D   F                                       V E M E             6                 6   6     6 S D                            
                                                                                                                           
                            *               2 4 0                   *               2 6 0                   *              
D E O D _ E C O L I   :   T A A E R Q T T F N D M I K I A L E S V L L G D K E - - - - - - - - - - - - - - - - -   :   2 3 8
D E O D _ L A C L C   :   T S E E R Q L T F T D M M K V G L E T L I A E - - - - - - - - - - - - - - - - - - - -   :   2 3 4
D E O D _ B A C S U   :   T A E E R Q T T F H D M I E V A L H S V S Q - - - - - - - - - - - - - - - - - - - - -   :   2 3 3
M T N N _ H A E I N   :   S M S F E E F L P L A A K Q S S A L V L G M I D R L - - - - - - - - - - - - - - - - -   :   2 2 9
M T N N _ T R E P A   :   S M S Y K E F S T R A A R R S A L L T L R V L E R L S A L R T S V V A S L F P M V V V   :   2 6 9
                          3         2                           6                                                          
Матрица попарной идентичности
Результаты

Но если брать выравнивания только первых трех или последних двух последовательностей, то число совпавших колонок будет равно 72

Если учесть, что первые три и последние две последовательности - две группы ортологов, то можно сделать вывод, что ClustalW хорошо выравнивает последовательности белков ортологов, но выравнивание последовательностей гомологов с разными функциями далеко от эталонного.


©Кармушаков Азар