Консервативные аминокислотные остатки в выборке 10 потенциальных ортологов белка CLCA_ECOLI


С помощью поисковой системы BLASTP была создана выборка из 10 ортологов белка CLCA_ECOLI. Как оказалось, ортологов у этого белка не очень много, поэтому identity меняется от 44% до 79% (в задании предполагалось от 50% до 75%).

Далее представлена матрица попарного сходства (в % совпадения) последовательностей выборки:
CLCA_ECO57 CLCA_SHIFL CLCA_ECOL6 CLCA_SALTI CLCA_SALPA CLCA_SALTY CLCA_YERPE CLCA_VIBRA CLCA_VIBVU CLCA_VIBCH
CLCA_ECO57 100%
CLCA_SHIFL 99% 100%
CLCA_ECOL6 99% 99% 100%
CLCA_SALTI 78% 78% 78% 100%
CLCA_SALPA 78% 77% 78% 99% 100%
CLCA_SALTY 78% 77% 78% 99% 99% 100%
CLCA_YERPE 69% 69% 69% 73% 73% 73% 100%
CLCA_VIBPA 52% 52% 52% 54% 54% 54% 54% 100%
CLCA_VIBVU 52% 51% 52% 53% 53% 53% 52% 88% 100%
CLCA_VIBCH 52% 52% 52% 53% 53% 53% 53% 80% 80% 100%

Как видно из матрицы, ортологи выбраны не очень удачно, так как имеются сильно схожие последовательности. Однако, в силу того, что других ортологов с "хорошим" identity нет, придётся оставить эти последовательности.

Далее представлено множественное выравнивание этих последовательностей.




Множественное выравнивание


Цветом выделены консервативные участки:
  1. Зелёным - консервативные на 100%;
  2. Красным - консервативные не менее, чем на 80%.

                                                                                                                                                             
                                            *                 2 0                   *                 4 0                   *                 6 0            
C L C A _ E C O 5 7   :   M K T D T P S L E T P Q A A R L R R R Q L I R Q L L E R D K T P L A I L F M A A V V G T L V G L A A V A F D K G V A W L   :     6 0
C L C A _ S H I F L   :   M K T D T P S L E T P Q A A R L R R R Q L I R Q L L E R D K T P L A I L F M A A V V G T L V G L A A V A F D K G V A W L   :     6 0
C L C A _ E C O L 6   :   M K T D T P S L E T P Q A A R L R R R Q L I R Q L L E R D K T P L A I L F M A A V V G T L V G L A A V A F D K G V A W L   :     6 0
C L C A _ S A L T I   :   M K T D T S T F L A Q Q I V R L R R R D Q I R R L M Q R D K T P L A I L F M A A V V G T L T G L V G V A F E K T V S W V   :     6 0
C L C A _ S A L P A   :   M K T D T S T F L A Q Q I V R L R R R D Q I R R L M Q R D K T P L A I L F M A A V V G T L T G L V G V A F E K T V S W V   :     6 0
C L C A _ S A L T Y   :   M K T D T S T F L A Q Q I V R L R R R D Q I R R L M Q R D K T P L A I L F M A A V V G T L T G L V G V A F E K A V S W V   :     6 0
C L C A _ Y E R P E   :   M T H S T Q Q L S P E G V A E G K R G R L I R E L V N R D K T P L I I L I M A A V V G V V T G L L G V A F D R G V D W V   :     6 0
C L C A _ V I B P A   :   - - M T K R E R I V K S V L A H V P K D A I N Q F V S R G S T P F S V L I M A A I V G T L A G F V G T Y F E L A V H F V   :     5 8
C L C A _ V I B V U   :   - - M T K R E R I I Q S V L V K V P K D A I N Q F L S H G S T P I S V L F L A A L V G V L A G L V G T Y F E I A V H F V   :     5 8
C L C A _ V I B C H   :   - - M S T R E T F K I S L L A K M P K D V I N Q F L S K D K T P F S V L F L S L L V G I L A G L V G T Y F E Q A V H L V   :     5 8
                                  t                                 I           r d k T P       L f m a a   V G   l   G l         F       V                  
                                                                                                                                                             
                                            *                 8 0                   *               1 0 0                   *               1 2 0            
C L C A _ E C O 5 7   :   Q N Q R M G A L V H T A D N Y P L L L T V A F L C S A V L A M F G Y F L V R K Y A P E A G G S G I P E I E G A L E D Q R   :   1 2 0
C L C A _ S H I F L   :   Q N Q R M G A L V H T A D N Y P L L L T V A F L C S A V L A M F G Y F L V R K Y A P E A G G S G I P E I E G A L E D Q R   :   1 2 0
C L C A _ E C O L 6   :   Q N Q R M G A L V H T A D N Y P L L L T V A F L C S A V L A M F G Y F L V R K Y A P E A G G S G I P E I E G A L E D Q R   :   1 2 0
C L C A _ S A L T I   :   Q N M R I G A L V Q V A D H A F L L W P L A F I L S A L L A M V G Y F L V R K F A P E A G G S G I P E I E G A L E E L R   :   1 2 0
C L C A _ S A L P A   :   Q N M R I G A L V Q V A D H A F L L W P L A F I L S A L L A M V G Y F L V R K F A P E A G G S G I P E I E G A L E E L R   :   1 2 0
C L C A _ S A L T Y   :   Q N M R I G A L V Q V A D H A F L L W P L A F I L S A L L A M V G Y F L V R K F A P E A G G S G I P E I E G A L E E L R   :   1 2 0
C L C A _ Y E R P E   :   Q Q Q R L L A L A N V A D Y A L L V W P L A F I M S A L L A M M G Y F L V S R F A P E A G G S G I P E I E G A M E E M R   :   1 2 0
C L C A _ V I B P A   :   S E T R T E W L R S E I G S V L P L W L A A V L I S A L L A F I G Y F L V H R F A P E A A G S G I P E I E G A M D N I R   :   1 1 8
C L C A _ V I B V U   :   S E T R T E W L K S E I G H L L P L W L A A I L I S A A L A F V G Y F L V H R F A P E A A G S G I P E I E G A M D N I R   :   1 1 8
C L C A _ V I B C H   :   S E T R T D W L K S E I G S F L P L W L A A F L I S A F L A F I G Y F L V H R F A P E A A G S G I P E I E G A M D G M R   :   1 1 8
                                R       L                   l       A f     S A   L A     G Y F L V       A P E A   G S G I P E I E G A         R            
                                                                                                                                                             
                                            *               1 4 0                   *               1 6 0                   *               1 8 0            
C L C A _ E C O 5 7   :   P V R W W R V L P V K F F G G L G T L G G G M V L G R E G P T V Q I G G N I G R M V L D V F R L K G D E A R H T L L A T   :   1 8 0
C L C A _ S H I F L   :   P V R W W R V L P V K F F G G L G T L G G G M G L G R E G P T V Q I G G N I S R M V L D I F R L K G D E A R H T L L A T   :   1 8 0
C L C A _ E C O L 6   :   P V R W W R V L P V K F F G G L G T L G G G M V L G R E G P T V Q I G G N I G R M V L D V F R L K G D E A R H T L L A T   :   1 8 0
C L C A _ S A L T I   :   P V R W W R V L P V K F I G G M G T L G A G M V L G R E G P T V Q I G G N L G R M V L D V F R M R S A E A R H T L L A T   :   1 8 0
C L C A _ S A L P A   :   P V R W W R V L P V K F I G G M G T L G A G M V L G R E G P T V Q I G G N L G R M V L D V F R M R S A E A R H T L L A T   :   1 8 0
C L C A _ S A L T Y   :   P V R W W R V L P V K F I G G M G T L G A G M V L G R E G P T V Q I G G N L G R M V L D V F R M R S A E A R H T L L A T   :   1 8 0
C L C A _ Y E R P E   :   P V R W W R V I P V K F I G G L G T L G A G M V L G R E G P M V Q M G G N S G R M I V D I F R L R S P E A R H S L L A T   :   1 8 0
C L C A _ V I B P A   :   P V R W W R V L P V K F F G G M G A L G S G M V L G R E G P T V Q M G G A V G R M V T D I F R V K D D D T R H S L L A S   :   1 7 8
C L C A _ V I B V U   :   P V R W W R V I P V K F F G G M G A L G S G M V L G R E G P T V Q M G G A V G R M V T D I F R V K D D D T R H S L L A S   :   1 7 8
C L C A _ V I B C H   :   P V R W W R V L P V K F F G G M G A L G S G M V L G R E G P T V Q M G G A V G R M I S D I F R V K N E D T R H S L L A A   :   1 7 8
                          P V R W W R V l P V K F   G G   G   L G   G M v L G R E G P t V Q   G G     g R M v   D   F R             R H   L L A              
                                                                                                                                                             
                                            *               2 0 0                   *               2 2 0                   *               2 4 0            
C L C A _ E C O 5 7   :   G A A A G L A A A F N A P L A G I L F I I E E M R P Q F R Y T L I S I K A V F I G V I M S T I M Y R I F N H E V A L I D   :   2 4 0
C L C A _ S H I F L   :   G A A A G L A A A F N A P L A G I L F I I E E M R P Q F R Y T L I S I K A V F I G V I M S T I M Y R I F N H E V A L I D   :   2 4 0
C L C A _ E C O L 6   :   G A A A G L A A A F N A P L A G I L F I I E E M R P Q F R Y T L I S I K A V F I G V I M S T I M Y R I F N H E V A L I D   :   2 4 0
C L C A _ S A L T I   :   G A A A G L S A A F N A P L A G I L F I I E E M R P Q F R Y N L I S I K A V F T G V I M S S I V F R I F N G E A P I I E   :   2 4 0
C L C A _ S A L P A   :   G A A A G L S A A F N A P L A G I L F I I E E M R P Q F R Y N L I S I K A V F T G V I M S S I V F R I F N G E A P I I E   :   2 4 0
C L C A _ S A L T Y   :   G A A A G L S A A F N A P L A G I L F I I E E M R P Q F R Y N L I S I K A V F T G V I M S S I V F R I F N G E A P I I E   :   2 4 0
C L C A _ Y E R P E   :   G A A A G L S A A F N A P L A G I L F V I E E M R S Q F R Y S L V S I K A V F I G V I T S T I V Y R Y F N G E R A I I E   :   2 4 0
C L C A _ V I B P A   :   G A A G G L A A A F N A P L A G I M F V V E E M R P Q F R Y S L I S I R A V I I S A I M A N I V F R A I N G Q D A V I T   :   2 3 8
C L C A _ V I B V U   :   G A A G G L A A A F N A P L A G I M F V V E E M R P Q F R Y S L I S I R A V I I S A V M A N I V F R A I N G Q D A V I T   :   2 3 8
C L C A _ V I B C H   :   G A A G G L A A A F N A P L A G I M F V I E E M R P Q F R Y T L I S V R A V I I S A V A A N I V F R V I N G Q D A V I T   :   2 3 8
                          G A A   G L   A A F N A P L A G I   F   i E E M R p Q F R Y   L i S i   A V         i m     I     R     N           I              
                                                                                                                                                             
                                            *               2 6 0                   *               2 8 0                   *               3 0 0            
C L C A _ E C O 5 7   :   V G K L S D A P L N T L W L Y L I L G I I F G I F G P I F N K W V L G M Q D L L H R V H G G N I T K W V L M G G A I G G   :   3 0 0
C L C A _ S H I F L   :   V G K L S D A P L N T L W L Y L I L G I I F G I F G P I F N K W V L G M Q D L L H R V H G G N I T K W V L M G G A I G G   :   3 0 0
C L C A _ E C O L 6   :   V G K L S D A P L N T L W L Y L I L G I I F G I F G P I F N K W V L G M Q D L L H R V H G G N I T K W V L M G G A I G G   :   3 0 0
C L C A _ S A L T I   :   V G K L S D A P V N T L W L Y L I L G I I F G C V G P V F N S L V L R T Q D M F Q R F H G G E I K K W V L M G G A I G G   :   3 0 0
C L C A _ S A L P A   :   V G K L S D A P V N T L W L Y L I L G I I F G C V G P V F N S L V L R T Q D M F Q R F H G G E I K K W V L M G G A I G G   :   3 0 0
C L C A _ S A L T Y   :   V G K L S D A P V N T L W L Y L I L G I I F G C V G P V F N S L V L R T Q D M F Q R F H G G E I K K W V L M G G A I G G   :   3 0 0
C L C A _ Y E R P E   :   V G K L S D A P L N T L W L Y L L L G I I F G A V G V I F N A L I F R T Q D M F V R F H G G D W R K L V L I G G L L G G   :   3 0 0
C L C A _ V I B P A   :   M P Q Y Q S P A L Q T L W L F L L L G A L F G V F G V I F N K L I T V A Q D S F V A I H K N D R K R Y L I T G S I L G G   :   2 9 8
C L C A _ V I B V U   :   M P Q Y Q P P E L K A L W L F L L L G G L F G V F G V L F N K L V T V A Q D A F V A L H K N D R K R Y L I T G T C L G G   :   2 9 8
C L C A _ V I B C H   :   M P Q Y D A P E L S T L G L F L L L G A L F G V F G V L F N Y L I T L A Q D L F V K F H R N D R K R Y L L T G S M I G G   :   2 9 8
                                              t L w L   L   L G     F G     G     F N             Q D           H                 l   G       G G            
                                                                                                                                                             
                                            *               3 2 0                   *               3 4 0                   *               3 6 0            
C L C A _ E C O 5 7   :   L C G L L G F V A P A T S G G G F N L I P I A T A G N F S M G M L V F I F V A R V I T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ S H I F L   :   L C G L L G F V A P A T S G G G F N L I P I A T A G N F S M G M L V F I F V A R V I T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ E C O L 6   :   L C G L L G F V A P A T S G G G F N L I P I A T A G N F S M G M L V F I F V A R V I T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ S A L T I   :   L C G I L G L I E P A A A G G G F N L I P I A A A G N F S V G L L L F I F I T R V V T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ S A L P A   :   L C G I L G L I E P A A A G G G F N L I P I A A A G N F S V G L L L F I F I T R V V T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ S A L T Y   :   L C G I L G L I E P A A A G G G F N L I P I A A A G N F S V G L L L F I F I T R V V T T L L C F S S G A P G G I F A P M   :   3 6 0
C L C A _ Y E R P E   :   M C G L L A L L H G N A V G G G F A L I P I A A A G N F S I G M L L F I F I A R V I T T L L C F G S G A P G G I F A P M   :   3 6 0
C L C A _ V I B P A   :   V F G L L L L Y V P Q L T G G G I A L I P D V T T G N Y S I S I L V L L F I G R V V T T L L C F G S G A P G G I F A P M   :   3 5 8
C L C A _ V I B V U   :   I F G L L L L Y V P E L T G G G I H L I P D V T N G N Y S V S L L V M L F V G R V L T T L I C F G S G A P G G I F A P M   :   3 5 8
C L C A _ V I B C H   :   C F G L L L L Y V P E L T G G G I S L I P T I T N G G Y G A G I L L L L F V G R I F T T L L C F G S G A P G G I F A P M   :   3 5 8
                              G   L         p       G G G     L I P         G n   s   g   L       F     R v   T T L l C F   S G A P G G I F A P M            
                                                                                                                                                             
                                            *               3 8 0                   *               4 0 0                   *               4 2 0            
C L C A _ E C O 5 7   :   L A L G T V L G T A F G M V A V E L F P Q Y H L E A G T F A I A G M G A L L A A S I R A P L T G I I L V L E M T D N Y Q   :   4 2 0
C L C A _ S H I F L   :   L A L G T V L G T A F G M V A V E L F P Q Y H L E A G T F A I A G M G A L L A A S I R A P L T G I I L V L E M T D N Y Q   :   4 2 0
C L C A _ E C O L 6   :   L A L G T V L G T A F G M V A V E L F P Q Y H L E A G T F A I A G M G A L L A A S I R A P L T G I I L V L E M T D N Y Q   :   4 2 0
C L C A _ S A L T I   :   L A L G T L L G T A F G M A A A V L F P Q Y H L E A G T F A I A G M G A L M A A S V R A P L T G I V L V L E M T D N Y Q   :   4 2 0
C L C A _ S A L P A   :   L A L G T L L G T A F G M A A A V L F P Q Y H P E A G T F A I A G M G A L M A A S V R A P L T G I V L V L E M T D N Y Q   :   4 2 0
C L C A _ S A L T Y   :   L A L G T L L G T A F G M A A A V L F P Q Y H L E A G T F A I A G M G A L M A A S V R A P L T G I V L V L E M T D N Y Q   :   4 2 0
C L C A _ Y E R P E   :   L A L G T I L G T A F G L S C A H F F P Q Y G I E A G T F A I A G M G A L F A A S V R A P L T G I V L V L E M T D N Y Q   :   4 2 0
C L C A _ V I B P A   :   L A L G T L F G Y A F G A S A D V L L P T L D I E P G V F A I A G M G A L F A A T V R A P I T G I L L V I E M T N N Y Y   :   4 1 8
C L C A _ V I B V U   :   L A L G T L F G Y A F G A T A K I L L P D L P I E P G M F A I A G M G A L F A A T V R A P I T G I L L V I E M T N N Y Y   :   4 1 8
C L C A _ V I B C H   :   L A L G T L F G Y A F G L I A K M W F P E L N I E P G M F A I A G M G A L F A A T V R A P I T G I L L V I E M T N N Y H   :   4 1 8
                          L A L G T     G   A F G     a     l f P         E   G   F A I A G M G A L   A A     R A P   T G I   L V   E M T   N Y              
                                                                                                                                                         
                                            *               4 4 0                   *               4 6 0                   *                            
C L C A _ E C O 5 7   :   L I L P M I I T G L G A T L L A Q F T G G K P L Y S A I L A R T L A K Q E A E Q L A R S K A A S A S E N T - - - - -   :   4 7 3
C L C A _ S H I F L   :   L I L P M I I T G L G A T L L A Q F T G G K P L Y S A I L A R T L A K Q E A E Q L A R S K A A S A S E N T - - - - -   :   4 7 3
C L C A _ E C O L 6   :   L I L P M I I T G L G A T L L A Q F T G G K P L Y S A I L A R T L A K Q E A E Q L A R S K A A S A R E N T - - - - -   :   4 7 3
C L C A _ S A L T I   :   L I L P M I I T C L G A T L L A Q F L G G K P L Y S T I L A R T L A K Q D A E Q A A K N Q N A P A G E N T - - - - -   :   4 7 3
C L C A _ S A L P A   :   L I L P M I I T C L G A T L L A Q F L G G K P L Y S T I L A R T L A K Q D A E Q A A K N Q N A P A G E N T - - - - -   :   4 7 3
C L C A _ S A L T Y   :   L I L P M I I T C L G A T L L A Q F L G G K P L Y S T I L A R T L A K Q D A E Q A E K N Q N A P A D E N T - - - - -   :   4 7 3
C L C A _ Y E R P E   :   L I L P M I V T C L G A T L I A Q F M G G K P L Y S A I L A R T L A K Q E Q A R A T V I A Q E P A V E N T P Q I G K   :   4 7 8
C L C A _ V I B P A   :   L I L P L I I T C L G A V I V A Q L L G G Q P I Y S Q L L H R T L K N D K L R Q Q D L P E N Q A S - - - - - - - - -   :   4 6 7
C L C A _ V I B V U   :   L I L P L I I T S L G A V I C A Q I C G G K P I Y S Q L L H R T I K N D K L R Q Q D L P E Q Q N S - - - - - - - - -   :   4 6 7
C L C A _ V I B C H   :   L I L P L I I T S L G A V I F A Q L L G G Q P I Y S Q L L H R T L K N Q K L Q Q Q D L P P Q S P N S - - - - - - - -   :   4 6 8
                          L I L P   I i T   L G A       A Q     G G k P   Y S     L   R T l     q       q                                                




Область взаимодействия с лигандом


Далее, с помощью программы RasMol были определены аминокислотные остатки, взаимодействующие с лигандом (ионом хлора cl444):
  • ser107
  • ile109
  • glu148
  • gly149
  • phe348
  • gly354
  • gly355
  • ile356
  • phe357
  • tyr445
На этом рисунке изображено расположение выделенных аминокислотных остатков относительно лиганда - иона хлора (зелёный шар).

Нет надобности красить аминокислотные остатки, в зависимости от консервативности, так как все они оказались на 100% консервативны (по сделанной выборке). Поэтому, остатки покрашены в зависимости от аминокислоты:

  • Жёлтый - глицин,
  • Синий - серин,
  • Красный - изолейцин,
  • Серый - тирозин,
  • Голубой - фенилаланин,
  • Белый - глутаминавая кислота.




Выводы


Как видно из постороенного выравнивания, белок CLCA_ECOLI вообще довольно консервативен. Зоны контакта с лигандом ососбенно. Отсюда можно заключить, что белок несёт важную функцию, притом необходимую многим, пусть и родственным, организмам. Впрочем, так оно и есть, так как CLCA_ECOLI обеспечивает транспорт ионов хлора через мембрану, что является немалозначимой частью метаболизма. Так же консервативность белка ещё объясняется и тем, что для выполнения сей функции необходима чётко определённая структура, наличие определённых аминокислотных остатков в определённых позициях.

На главную...


© Трушкин Никита,2005