benchmark_aln

На главную страницу второго семестра

Сравнение фрагмента полного множественного выравнивания, полученного с помощью программы ClustalW, с соответствующим фрагментом "эталонного" выравнивания из SMART

1. Из эталонного выравнивания (CoaE.msf) для дальнейшей работы был получен фрагмент толщиной в 5 аминокислотных последовательностей и длиной в 78 а.о.
                                                                                                                                                                                               
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                          
C O A E _ E C O L I   :   P Y V L W V V P L L V E N - S L Y K K A N R V L V V D V S P E T Q L K R T M Q R D - D V T R E H V E Q I L A A Q A T R E A R L A V A D D V I D N - N G A P D   :   7 5
C O A E _ A E R H Y   :   P Y C L L V V P L L V E N - K L T G L A N R V L V I D V D E A T Q I E R T C R R D - G V S R E Q V Q A I L A A Q A S R A E R L A A A D D V L D N K N G A P E   :   7 6
C O A E _ N E I G O   :   V Y G I V E I P L L T E K R Q F I S L I R R V L T I S A P L E K R I G R V M A R S - G L T R G E V A D I I S H Q A S E S E R L L L A D D V L L N D G S L K S   :   7 7
Y N P 5 _ C A E E L   :   K Y I V F D T P L L F E S - G Y D K W I G T T I V V W C D F E Q E V E R M V T R D - N I S R A D A E S R I H A Q M D I E E K K K R A K I V I D N N G N I D E   :   7 6
Y D 1 9 6 _ Y E A S   :   R M C V L D V P L L F E G - N L D S I C G V T V S V I C T Q E L Q L E R L M T R N P E L S E E D A K N R L N S Q M S T E E R M A R S D Y I L Q N N S T L V D   :   7 7
                                6       P L L   E                       6   6               6   R       R       6 3               6     Q           4             6 6   N                      

2. С помощью программы Clustalw было построено множественное выравнивание на основе полных аминокислотных последовательностей белков взятых из файла full_seq.fasta (последовательности в этом документе взяты из SRS по идентификаторам UniProt; при этом белок YD96_YEAST не обнаружился, и пришлось искать его по последовательности через программу blastp: обновленное название - YD196_YEAST).
                                                                                                                                                                                                   
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                              
C O A E _ E C O L I   :   P Y V L W V V P L L V E N - S L Y K K A N R V L V V D V S P E T Q L K R T M Q R D D - V T R E H V E Q I L A A Q A T R E A R L A V A D D V I D N - N G A P D A   :     7 6
C O A E _ A E R H Y   :   P Y C L L V V P L L V E N - K L T G L A N R V L V I D V D E A T Q I E R T C R R D G - V S R E Q V Q A I L A A Q A S R A E R L A A A D D V L D N K N G A P E T   :     7 7
C O A E _ N E I G O   :   V Y G I V E I P L L T E K R Q F I S L I R R V L T I S A P L E K R I G R V M A R S G - L T R G E V A D I I S H Q A S E S E R L L L A D D V L L N - D G S L K S   :     7 7
Y N P 5 _ C A E E L   :   K Y I V F D T P L L F E S - G Y D K W I G T T I V V W C D F E Q E V E R M V T R D N - I S R A D A E S R I H A Q M D I E E K K K R A K I V I D N - N G N I D E   :     7 6
Y D 1 9 6 _ Y E A S   :   R M C V L D V P L L F E G - N L D S I C G V T V S V I C T Q E L Q L E R L M T R N P E L S E E D A K N R L N S Q M S T E E R M A R S D Y I L Q N - N S T L V D   :     7 7
                                6       P L L   E                       6   6               6   R       R       6 3               6     Q           4             6 6   N   1                      
Более темным сиреневым фоном выделены те части последовательности, которые присутствуют в вырезке из эталонного выравнивания.

Результаты


Матрица попарного совпадения последовательностей.


Такие высокие проценты в обоих матрицах указывают на близкое сродство белков между собой. Тем не менее проценты попарного совпадения в матрице, построенной по выравниванию Clustalw несколько ниже, чем в другой, что и ожидалось, так как Clustalw строит глобальное выравнивание, которое в некоторой степени может быть ошибочно (чего мы в принципе не можем сказать об эталонном).


©Куликовский, Алексей