Матрицы весов аминокислотных замен


Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку CLCA_ECOLI


                                                                             
                                            *                 2 0            
C I C H _ T O R C A   :   V P C G A F V P V F N L G A V L G R F V G   :   2 1
C I C H _ T O R M A   :   V P C G A F V P V F N L G A V L G R F V G   :   2 1
C I C K _ H U M A N   :   M P A G Y F M P I F I L G A A I G R L L G   :   2 1
C I C K _ M O U S E   :   M P A G Y F M P I F I I G A A I G R L L G   :   2 1
C I C K _ R A B I T   :   M P A G Y F L P I F I I G A A I G R L L G   :   2 1
C I C K _ R A T | Q   :   M P A G Y F M P I F I I G A A I G R L L G   :   2 1
C I C L _ H U M A N   :   M P A G Y F M P I F V Y G A A I G R L F G   :   2 1
C I C L _ M O U S E   :   I P A G Y F L P I F V Y G A V I G R L F G   :   2 1
C I C L _ R A B I T   :   M P A G Y F L P I F I I G A A I G R L L G   :   2 1
C I C L _ R A T | P   :   I P A G Y F L P I F V Y G A A I G R L F G   :   2 1
C L C 1 _ H U M A N   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
C L C 1 _ M O U S E   :   I P C G V N M P V F V L G A A F G R L V G   :   2 1
C L C 1 _ R A T | P   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
C L C 2 _ C A V P O   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
C L C 2 _ H U M A N   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
C L C 2 _ M O U S E   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
C L C 2 _ R A B I T   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
C L C 2 _ R A T | P   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
C L C 3 _ C A V P O   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
C L C 3 _ H U M A N   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
C L C 3 _ M O U S E   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
C L C 3 _ R A B I T   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
C L C 3 _ R A T | P   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
C L C 4 _ H U M A N   :   I P S G L F I P S M A V G A I A G R M V G   :   2 1
C L C 4 _ M O U S E   :   I P S G L F I P S M A V G A M A G R M V G   :   2 1
C L C 4 _ R A T | P   :   I P S G L F I P S M A V G A M A G R M V G   :   2 1
C L C 5 _ H U M A N   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
C L C 5 _ M O U S E   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
C L C 5 _ R A T | P   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
C L C 6 _ H U M A N   :   V P S G L F V P S L L C G A A F G R L V A   :   2 1
C L C 6 _ M O U S E   :   V P S G L F V P S L L C G A A F G R L V A   :   2 1
C L C 6 _ R A B I T   :   V P S G L F V P S L L C G A A F G R L V A   :   2 1
C L C 7 _ H U M A N   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
C L C 7 _ M O U S E   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
C L C 7 _ R A T | P   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
C L C A _ A R A T H   :   T P S G L F L P I I L M G S A Y G R M L G   :   2 1
C L C A _ V I B C H   :   A P G G I F A P M L A L G T L F G Y A F G   :   2 1
C L C A _ V I B V U   :   A P G G I F A P M L A L G T L F G Y A F G   :   2 1
C L C A _ V I B V Y   :   A P G G I F A P M L A L G T L F G Y A F G   :   2 1
C L C B _ A R A T H   :   T P S G L F L P I I L M G A A Y G R M L G   :   2 1
C L C C _ A R A T H   :   I P S G L F I P V I L A G A S Y G R L V G   :   2 1
C L C D _ A R A T H   :   V P A G Q F V P G I M I G S T Y G R L V G   :   2 1
C L C G _ A R A T H   :   A P A G L F V P V I V T G A S Y G R F V G   :   2 1
G E F 1 _ Y E A S T   :   V P A G I F V P S M A V G A T F G R A V S   :   2 1
O 1 3 0 8 0 | 5 1 2   :   V P S G L F I P S M A V G A I M G R L L G   :   2 1
O 1 4 8 6 4 | 4 5 4   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
O 1 4 9 1 8 | 5 2 2   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
O 5 4 8 2 1 | 4 6 0   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
O 5 4 8 2 2 | 4 6 0   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
O 6 0 1 5 9 | 4 8 7   :   V P A G I F V P S M A V G A S F G Y M I G   :   2 1
O 6 0 9 5 8 | 4 5 0   :   L P A G I L V P S L T I G A L Y G R A F G   :   2 1
O 6 4 9 9 0 | 4 7 5   :   T P S G L F L P I I L M G S A Y G R M L G   :   2 1
O 8 1 4 9 1 | 4 8 3   :   V P A G Q F V P G I M I G S T Y G R L V G   :   2 1
O 9 4 2 8 7 | 4 0 6   :   I P T G I I V P S L A I G A C I G R A V G   :   2 1
P 7 4 4 7 7 | 3 3 8   :   A P G G L F A P A L V M G S A L G Y L V G   :   2 1
P 9 3 5 6 7 | 4 7 0   :   I P S G L F I P V I L A G A S Y G R I F G   :   2 1
P 9 7 2 7 4 | 4 6 4   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 1 7 8 0 4 | 4 3 0   :   V P C G L F V P S I G M G A I A G R I L G   :   2 1
Q 1 8 3 6 8 | 4 2 1   :   V P A G V F V P S F I I G A A G G R L M G   :   2 1
Q 1 9 0 6 7 | 4 0 7   :   V P S G I F M P V F V L G A A F G R L V G   :   2 1
Q 2 1 7 9 1 | 5 0 7   :   V P S G V F I P A I L T G A A W G R L F G   :   2 1
Q 2 2 2 7 0 | 4 3 6   :   V P S G V F L P V F V L G A A I G R F Y G   :   2 1
Q 2 2 8 3 3 | 4 7 6   :   I P S G I F V P C F V I G A C G G R I F G   :   2 1
Q 4 0 4 8 5 | 4 8 5   :   I P S G L F I P V I L A G A S Y G R F V G   :   2 1
Q 5 Z L 6 0 | 5 0 5   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
Q 6 0 L Z 8 | 4 9 3   :   V P S G V F I P A I L T G A A W G R L F G   :   2 1
Q 6 1 9 D 8 | 5 1 5   :   V P T G V F L P V F V L G A A I G R L Y G   :   2 1
Q 6 1 C 2 4 | 5 0 2   :   V P S G I F M P V F V L G A A F G R L V G   :   2 1
Q 6 1 Z 5 6 | 4 9 2   :   V P C G L F V P S I G M G A I A G R I L G   :   2 1
Q 6 1 Z G 3 | 4 9 7   :   I P S G I F V P C F V I G A C G G R I F G   :   2 1
Q 6 1 Z Y 2 | 4 5 2   :   V P A G V F V P S F I I G A A G G R L I L   :   2 1
Q 6 6 H N 9 | 4 2 1   :   M P A G Y F M P I F I I G A A I G R L L G   :   2 1
Q 6 A I P 2 | 3 5 5   :   N S G G V F A P S L F T G A M L G G A M G   :   2 1
Q 6 A X 8 6 | 4 2 2   :   M P A G Y F M P V F V F G A A I G R L V G   :   2 1
Q 6 B L Q 5 | 4 3 6   :   V P A G I F V P S M A T G A T F G R A L G   :   2 1
Q 6 B N C 8 | 6 7 1   :   L P C G I Y V P S M V I G A L Y G R T F A   :   2 1
Q 6 C 6 J 6 | 4 6 6   :   L P A G I I I P S M C I G A L F G R A V G   :   2 1
Q 6 C B C 6 | 6 5 8   :   V P A G I Y V P S M I I G A L F G R V L G   :   2 1
Q 6 C I 0 0 | 4 3 5   :   V P A G I F V P S M A V G A T F G R L I G   :   2 1
Q 6 C M 7 0 | 4 6 4   :   V P A G I F V P S M A V G A T F G R A V S   :   2 1
Q 6 F R 2 0 | 4 6 9   :   V P A G I F V P S M A I G A T F G R A V S   :   2 1
Q 6 G P 7 7 | 5 0 2   :   V S A G V F I P S L L L G A A W G R L F G   :   2 1
Q 6 I P A 9 | 4 5 4   :   V P C G A F M P V F V I D G I H T D S S T   :   2 1
Q 6 L D 5 1 | 3 8 1   :   V P C G A F M P V F V I G A A F G R L V G   :   2 1
Q 6 P E V 2 | 4 6 4   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 6 P G A 5 | 4 9 5   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 6 Y V X 5 | 5 0 1   :   V P S G L F I P V I L A G A T Y G R I V G   :   2 1
Q 6 Z D C 2 | 4 7 4   :   A P S G L F V P I I L T G A T Y G R L V A   :   2 1
Q 7 0 S 4 3 | 4 2 2   :   V P V G L F S T N I V V G S V L G R F I G   :   2 1
Q 7 4 H 9 8 | 3 2 5   :   L P S G I F L P I L T M G A L I G A T Y G   :   2 1
Q 7 5 1 T 7 | 4 7 2   :   V P A G I Y V P S M V I G A L F G R I F A   :   2 1
Q 7 5 7 T 3 | 4 4 7   :   V P A G I F V P S M A V G A T F G R S I S   :   2 1
Q 7 5 J F 3 | 4 8 1   :   V A G G L F V P M M M V G A G F G R L F G   :   2 1
Q 7 N D Q 1 | 3 2 6   :   A P G G V F A P S L V L G A A L G S L V G   :   2 1
Q 7 Q D 0 2 | 3 8 3   :   V P S G M F I P V F K I G A A F G R I I G   :   2 1
Q 7 Q J F 9 | 4 1 8   :   V S L G I F I P T L L I G A A W G R L I A   :   2 1
Q 7 R Y K 8 | 6 2 3   :   V P A G I Y V P S M V V G G L M G R L I G   :   2 1
Q 7 R Y X 3 | 5 6 7   :   I P A G I I L P S M A I G A L T G R A L G   :   2 1
Q 7 S 9 P 2 | 4 8 1   :   V P A G I F V P S M A I G A S F G R S V G   :   2 1
Q 7 T 3 2 9 | 4 3 8   :   L P A G Y F M P V F V Y G A A V G R F I G   :   2 1
Q 7 T T 7 4 | 4 4 9   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 7 T T 7 5 | 4 0 7   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 7 V 9 G 6 | 3 5 2   :   A P G G L F F P M L T L G G C I G S A C G   :   2 1
Q 7 X T M 5 | 4 9 2   :   L P S G L F V P V I L T G A T Y G R L V G   :   2 1
Q 7 Y U 6 3 | 5 3 3   :   V P S G M F I P V F K I G A G F G R L V G   :   2 1
Q 8 4 Q C 8 | 4 1 6   :   V P S G L F I P V I L A G A T Y G R I V G   :   2 1
Q 8 5 1 D 8 | 4 6 7   :   V P A G Q F V P G I M I G S T Y G R L V G   :   2 1
Q 8 6 9 D 8 | 4 8 7   :   I P T G L F I P S L G V G A L M G R L V G   :   2 1
Q 8 6 A Z 6 | 4 8 8   :   V A S G I F I P M M L I G S S W G R L I G   :   2 1
Q 8 6 Z 2 1 | 4 6 4   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 7 0 M 6 | 6 1 9   :   V P A G I Y V P S M V V G G L M G R I V G   :   2 1
Q 8 7 4 K 8 | 4 6 1   :   V P A G I F V P S M A V G A T F G R M I G   :   2 1
Q 8 8 Y H 1 | 3 2 8   :   L P G G I F L P I L S L G A I L G A I Y A   :   2 1
Q 8 B Z 4 1 | 4 7 9   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 8 C 6 W 8 | 4 5 0   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
Q 8 C B L 5 | 4 5 1   :   I P S G L F I P S M A V G A M A G R M V G   :   2 1
Q 8 C I 6 7 | 4 5 0   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
Q 8 D P R 2 | 3 4 2   :   L P G G I F L P I L A L G S L L G A L V G   :   2 1
Q 8 F W U 5 | 3 3 8   :   I P G G I F A P S L S V G A G L G S T I G   :   2 1
Q 8 I N J 7 | 5 1 6   :   V P S G M F I P V F K I G A G F G R L V G   :   2 1
Q 8 I Q N 2 | 5 2 9   :   V P A G L F I P S L L L G A I M G R I V G   :   2 1
Q 8 J Z U 7 | 4 2 1   :   M P A G Y F M P I F I I G A A I G R L L G   :   2 1
Q 8 K 3 N 1 | 4 4 8   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 8 K 4 W 7 | 4 6 4   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 K 4 W 8 | 4 9 5   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 K 4 W 9 | 4 9 5   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 K 4 X 0 | 5 2 2   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 K 4 X 1 | 5 2 2   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 8 K P T 6 | 3 2 2   :   A S G G I F A P A L V L G S S L G L G V V   :   2 1
Q 8 L P A 0 | 5 0 3   :   V P S G L F I P V I L A G A T Y G R I V G   :   2 1
Q 8 L P A 1 | 4 5 3   :   V P S G L F I P V I L A G A T Y G R I V G   :   2 1
Q 8 L P A 2 | 5 0 6   :   V P S G L F I P V I L A G A T Y G R I V G   :   2 1
Q 8 L R 1 8 | 4 7 9   :   V P S G L F I P V I L S G A S F G R L L G   :   2 1
Q 8 M Q K 2 | 5 8 9   :   V P A G L F I P S L L L G A I M G R I V G   :   2 1
Q 8 M R L 4 | 5 1 6   :   V P S G M F I P V F K I G A G F G R L V G   :   2 1
Q 8 M Y E 2 | 4 8 1   :   V A G G L F V P M M M V G A G F G R L F G   :   2 1
Q 8 P 7 F 6 | 3 3 5   :   I P G G L F S P A L A V G A G L G H N L S   :   2 1
Q 8 P I S 0 | 3 3 5   :   I P G G L F S P A L A V G A G I G H N L S   :   2 1
Q 8 Q G S 7 | 4 2 7   :   L P A G Y F M P V F I Y G A A I G R L I G   :   2 1
Q 8 V C F 8 | 4 2 1   :   I P A G Y F L P I F V Y G A V I G R L F G   :   2 1
Q 8 Y B K 3 | 3 4 9   :   I P G G I F A P S L S V G A G L G S T I G   :   2 1
Q 8 Y M P 2 | 3 2 2   :   A P G G L F A P S L I L G S A L G H L V G   :   2 1
Q 9 3 R S 4 | 3 3 9   :   G S G G V F A P S L F I G A T L G A A F G   :   2 1
Q 9 3 Y S 0 | 4 7 5   :   T P S G L F L P I I L M G S A Y G R M L G   :   2 1
Q 9 5 1 6 9 | 4 6 7   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 9 5 N L 9 | 4 5 2   :   V P A G V F V P S F I I G A A G G R L M G   :   2 1
Q 9 5 Q N 8 | 5 0 1   :   V P S G I F M P V F V L G A A F G R L V G   :   2 1
Q 9 5 V F 8 | 5 4 3   :   L A S G L F I P M M L V G A T F G R L V G   :   2 1
Q 9 5 Z P 4 | 5 1 2   :   V P S G V F L P V F V L G A A I G R F Y G   :   2 1
Q 9 5 Z P 5 | 5 1 2   :   V P S G V F L P V F V L G A A I G R F Y G   :   2 1
Q 9 6 3 2 5 | 4 7 3   :   T P S G L F L P I I L M G S A Y G R M L G   :   2 1
Q 9 6 R Y 8 | 5 0 9   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
Q 9 7 Q P 4 | 3 3 7   :   L P G G I F L P I L A L G S L L G A L V G   :   2 1
Q 9 9 J Z 2 | 4 2 0   :   I P S G L F I P S M A V G A M A G R M V G   :   2 1
Q 9 9 P 6 6 | 4 5 0   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
Q 9 B H B 2 | 4 9 3   :   V P S G V F I P A I L T G A A W G R L F G   :   2 1
Q 9 B M K 8 | 5 1 2   :   V P S G V F L P V F V L G A A I G R F Y G   :   2 1
Q 9 B M K 9 | 4 3 0   :   V P S G I F M P V F V L G A A F G R L V G   :   2 1
Q 9 G K E 7 | 4 5 0   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
Q 9 H P N 8 | 5 2 2   :   N S G G V F S P T L Y V G A M A G G A F G   :   2 1
Q 9 M Z T 1 | 4 7 9   :   I P C G G F M P V F V L G A A F G R L V G   :   2 1
Q 9 N F 9 5 | 5 4 3   :   V S G G L V V P S L V L G A V F G R L F G   :   2 1
Q 9 P U I 5 | 5 4 4   :   V P S G L F I P S M A V G A I T G R L L G   :   2 1
Q 9 P U I 6 | 4 6 3   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 9 P W K 7 | 5 1 2   :   V P S G L F I P S M A V G A I M G R L L G   :   2 1
Q 9 R 2 8 7 | 5 2 2   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
Q 9 T T U 3 | 4 5 0   :   I P S G L F I P S M A V G A I A G R L L G   :   2 1
Q 9 U 5 Y 3 | 4 9 5   :   I P S G I F V P C F V I G A C G G R I F G   :   2 1
Q 9 U 6 W 4 | 4 9 2   :   V P C G L F V P S I G M G A I A G R I L G   :   2 1
Q 9 U 6 W 5 | 4 4 0   :   V P S G V F L P V F V L G A A I G R F Y G   :   2 1
Q 9 U 6 W 7 | 4 2 1   :   V P A G V F V P S F I I G A A G G R L M G   :   2 1
Q 9 U 6 W 8 | 4 5 7   :   I P S G I F V P C F V I G A C G G R I F G   :   2 1
Q 9 U J H 7 | 4 6 2   :   V S A G V F I P S L L I G A A W G R L F G   :   2 1
Q 9 V 6 D 9 | 5 3 3   :   V S L G V F I P T A L V G A A W G R L L A   :   2 1
Q 9 V G H 7 | 5 3 3   :   V P S G M F I P V F K I G A G F G R L V G   :   2 1
Q 9 V G H 8 | 5 1 6   :   V P S G M F I P V F K I G A G F G R L V G   :   2 1
Q 9 W 7 0 1 | 4 2 3   :   M P A G Y F M P V F V F G A A I G R L V G   :   2 1
Q 9 X F 7 1 | 4 7 9   :   V P S G L F L P I I L M G S A Y G R L L A   :   2 1
Q 9 Y H 1 1 | 4 9 5   :   V P S G L F I P S M A I G A I A G R I V G   :   2 1
                            P   G   F   P         G A     G R     G          



Слева можно наблюдать изображение множественного выравнивания блока. Каждый цвет отвечает определённой степени консервативности колонок:

Синий — более 80% идентичности

Зелёный — более 60% идентичности

Красный — более 40% идентичности

Без цвета — менее 40% идентичности






Веса аминокислотных замен


Вычисление весов аминокислотных замен на основе множественного выравнивания блока CLCHANNEL из базы данных BLOCKS.

Пара аминокислот nαβ pαβ qα qβ sαβ
I-I
Изолейцин-изолейцин
5043 0,01777 0,1029 0,1029 1
I-V
Изолейцин-валин
11790 0,04154 0,1029 0,1053 2
I-R
Изолейцин-аргинин
0 0 0,1029 0,04113 -

С помощью программы pairs_count были посчитаны возможные аминокислотные пары в данном блоке(nαβ) и их общее кол-во(N).N=283794.

Далее все считалось по формулам:

  • pαβ - частота пары; pαβ=nαβ/N.
  • qα - частота аминокислоты α в паре; qα=pαα+ (pαβ+pαγ+...)/2.
  • qβ - частота аминокислоты β в паре; qβ=pαα+ (pαβ+pαγ+...)/2.
  • sαβ - вес аминокислотной замены; sαβ=2log2(pαβ/(2*qα*qβ)); sαα=2log2(pαα/qα2)






Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS

Пара аминокислот nαβ pαβ qα qβ sαβ
I-I
Изолейцин-изолейцин
2299008 0,010032 0,05435 0,05435 4
I-V
Изолейцин-валин
4059311 0,017713 0,05435 0,0664 3
I-R
Изолейцин-аргинин
982683 0,004288 0,05435 0,07081 -2

Здесь все считалось по тем же формулам, только был взят другой блок последовательностей.

N=283794.







Сравнение весов аминокислотных замен

Пара аминокислот Блок CLCHANNEL 200 блоков BLOSUM62
I-I
Изолейцин-изолейцин
1 4 4
I-V
Изолейцин-валин
2 3 3
I-R
Изолейцин-аргинин
- -2 -3

В этой таблице приведены данные предыдущих двух таблиц и данные матрицы BLOSUM62.

Рассмотрим столбец "BLOSUM62":

  • Самый большой вес замены имеет пара I-I, так как вероятность того, что аминокислота заменится на что-то, куда меньше, чем вероятность того, что она не изменится.
  • Вес замен пары I-V меньше, но тоже велик, так как аминокислоты изолейцин и валин очень похожи(радикалы отличаются на одну -CH3 группу).
  • Однако, вес замены пары I-R очень мал, потому что аминокислоты изолейцин и аргинин различны. Такая замена может повлиять на структуру и функции белка, сделав его ненужным для оргамизма. Следовательно такая замена маловероятна.

Как видно, столбцы "200 блоков" и "BLOSUM62" весьма схожи, что, впрочем, не удивительно, так как в обоих случаях брали довольно большое колличество последовательностей.

Однако, результаты в столбце "Блок CLCHANNEL" сильно отличаются от вышерассмотренных, что, впрочем, тоже не удивительно, так как в этом блоке рассматривались только последовательности белков, родственных белку CLCA_ECOLI, а значит имеющих определённый схожий аминокислотный состав.

На главную...


© Трушкин Никита,2005