Сравнение фрагмента полного множественного выравнивания, полученного с помощью программы ClustalW, с соответствующим фрагментом "эталонного" выравнивания из SMART

Цель задания - cравнить множественное выравнивание, построенное программой ClustalW, с "эталонным" выравниванием из банка выравниваний SMART.

Задание 1:В базе данных SMART получить изображение доменной структуры моего белка. Выбрать один из доменов и получить эталонное выравнивание доменов, гомологичных выбранному. Затем создать фрагмент для дальнейшего детального исследования с толщиной в 5 последовательностей и шириной в 50-80 а. о. Вырезать из эталонного выравнивания с помощью GeneDoc фрагмент для дальнейшего детального исследования. Толщина фрагмента должна быть 5 последовательностей, ширина - 50-80 остатков.

Cами а. о. последовательности белков:

1.SYH_ECOLI2.SYG_METTH3.SYS_ARATH4.SYT_THEMA5.SYP_MYCTU
представлены в файле full_seq.fasta

Фрагмент "эталонного" выравнивания из SMART:
                                                                                                                                                                         
                                            *                 2 0                   *                 4 0                   *                 6 0                        
S Y H _ E C O L I   :   I W Q R I E G T L K N V L G - S Y G Y S E I R L P I V E Q T P L F K R A I G E V T D V V E K E M Y T F E D R N G - - - - - - - - D S L   :   5 8
S Y S _ A R A T H   :   L N Q A L I N F G L T F L K K R - G F T G L Q P P F F M R K D V M A K - C - A Q L A Q F D E E L Y K V T G E G - - - - - - - - - D D K   :   5 5
S Y T _ T H E M A   :   V L N E L M K F S R E L H R - E R G Y Q E I F T P L I M N E Q L W K I - S G H W D H Y A E N - M Y F - I E K D E - - - - - - - - E R Y   :   5 5
S Y P _ M Y C T U   :   V L R N I E R V I R D E M N A I - G G Q E I L F P A L L P R A P Y E T - T N R W T Q Y G D S - V F R L K D R R G - - - - - - - - N D Y   :   5 6
S Y G _ M E T T H   :   L K N K I M N R W R E F Y V V R E G F Y E I E S P T I M P E E A L K A - S G H V D H F N D P - M T Q C K E C M D V Y R A D H I I E - -   :   6 3
                          6       6                         G     e 6     P                                             6                                                

Cамо "эталонное" выравнивание представлено в файле benchmark.msf

Задание 2: по идентификаторам UniProt из benchmark.msf получить с помощью SRS полные последовательности в формате Fasta, построить программой ClustalW множественное выравнивание последовательностей из full_seq.fasta программой emma пакета EMBOSS.

Фрагмент полного множественного выравнивания, полученного с помощью программы ClustalW:
                                                                                                                                                                                                       
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                    
S Y H _ E C O L I   :   A I R G M N D Y L P G E T A I W Q R I E G T L K N V L G S Y G Y S E I R L P I V E Q T P L F K R A I G E V T D V V E K E M Y T F E D R N G D S L T L R P E G T A G C   :     8 8
S Y S _ A R A T H   :   R R F A S V E I V D E I I K L D K E W R Q R Q F E V D S F R K E F N K L N K Q V A Q L K I K K E D A S E I I Q Q T E K N K Q D S T A K E A E V R E A Y A A L K A K L   :   1 0 5
S Y T _ T H E M A   :   R L Y G K E N V K L G I G P T I E N G F Y Y D F D I K N G R L T E E D L P K I E Q E M K K I I K E N L P I E R K E I S K E E A R E L F R D Q P Y K L E L I E E I E G   :   1 6 4
S Y P _ M Y C T U   :   V A P G L Y S W L P L G L R V L R N I E R V I R D E M N A I G G Q E I L F P A L L P R A P Y E T T N R W T Q Y G D S V F R L K D R R G N D Y L L G P T H E E L F T L   :   1 1 8
S Y G _ M E T T H   :   S S F E I Y S G V A G F V D Y G P L G A T L K N K I M N R W R E F Y V V R E G F Y E I E S P T I M P E E A L K A S G H V D H F N D P M T Q C K E C M D V Y R A D H I   :   1 0 2
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                  *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                        
S Y H _ E C O L I   :   V R A G I E H G L L Y N Q E Q R L W Y I G P M F R H E R P Q K G R Y R Q F H Q L G C E V F G L Q G P D I D A E L I M L T A R W W R A L G I S E H V T L E L N S I G S   :   1 7 0
S Y S _ A R A T H   :   E Q V G N L V H D S V P V D K D E A N N L V I K L W G E K R F S T P G L K L K N H V D L V E L L G I A D T K R G A E I A G A R G F F L K G D G L M L N Q A L I N F G   :   1 8 7
S Y T _ T H E M A   :   N R V T I Y R Q G E F V D L C R G P H L P S T G I V K H F K L L S V S G A Y W R G S E K N P M L T R V Y G T A F A K K E D L D N Y L K F L E E A Q R R D H R K L G P   :   2 4 6
S Y P _ M Y C T U   :   T V K G E Y S S Y K D F P L T L Y Q I Q T K Y R D E A R P R A G I L R A R E F V M K D S Y S F D I D A A G L K A A Y H A H R E A Y Q R I F D R L Q V R Y V I V S A V   :   2 0 0
S Y G _ M E T T H   :   I E D A T G R D V E G L E N Q E L T E I I S D E G I R C P R C G G H L T H V W S Y N L M F Q T L I G A R G K K T G Y L R P E T A Q G I F I P F K R L L R F F R N R L   :   1 8 4
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                              *               2 6 0                   *               2 8 0                   *               3 0 0                   *               3 2 0                            
S Y H _ E C O L I   :   L E A R A N Y R D A L V A F L E Q H K E K L D E D C K R R M Y T N P L R V L D S K N P E V Q A L L N D A P A L G D Y L D E E S R E H F A G L C K L L E S A G I A Y T   :   2 5 2
S Y S _ A R A T H   :   L T F L K K R G F T G L Q P P F F M R K D V M A K C A Q L A Q F D E E L Y K V T G E G D D K Y L I A T A E Q P L C A Y H I D E W I H P T E L P L R Y A G Y S S C F R   :   2 6 9
S Y T _ T H E M A   :   Q L E L F M L N T E Y A P G M P F F L P K G V V V L N E L M K F S R E L H R E R G Y Q E I F T P L I M N E Q L W K I S G H W D H Y A E N M Y F I E K D E E R Y A V K   :   3 2 8
S Y P _ M Y C T U   :   S G A M G G S A S E E F L A E S P S G E D A F V R C L E S G Y A A N V E A V V T A R P D T L P I D G L P E A V V H D T G D T P T I A S L V A W A N E A D L G R T V T   :   2 8 2
S Y G _ M E T T H   :   P F G V V Q L G K S Y R N E I S P R Q G V I R L R E F T Q A E A E I F V D P E H K T H P D F E E V K E D I L R L Y P A G R Q M E E S G T V D M T A A E A L E A G V I   :   2 6 6
                                                                                                                                                                                                       
Результаты:

Дополнительное задание 3: Получить матрицу попарного совпадения последовательностей.

Смартовское выравнивание

Выравнивание ClustalW

В таблицах указаны проценты идентичности последовательностей. Выравнивание в первом случае глобальное, поэтому 4% идентичности нас не должны удивить. Здесь выравнивание не одного домена, то есть в белках, вне сомнения, есть много непохожих участков. Смартовское выравнивание лучше.

На главную страницу семестра


©Ларионов Дмитрий