|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   | 1 | 0 |   |   |   |   | * |   |   |   | 2 | 0 |   |   |   |   | * |   |   |   | 3 | 0 |   |   |   |   |   |
D | E | F | 2 | _ | B | A | C | S | T |   |   | 1 |   | : |   | P | E | L | A | A | K | Y | G | L | R | P | G | I | G | L | A | A | P | Q | I | N | V | S | K | R | M | I | A | V | H |   | : |   | 3 | 0 | |
D | E | F | 2 | _ | B | A | C | S | U |   |   | 1 |   | : |   | P | E | L | A | E | K | Y | K | L | R | P | G | V | G | L | A | A | P | Q | I | N | I | K | K | R | M | I | A | V | H |   | : |   | 3 | 0 | |
D | E | F | _ | A | Q | U | A | E | | |   |   | 1 |   | : |   | R | D | M | F | D | T | M | Y | E | A | E | G | V | G | L | A | A | N | Q | I | G | V | P | L | S | V | M | V | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | B | A | C | S | U | | |   |   | 1 |   | : |   | D | D | M | Y | D | T | M | L | E | M | D | G | V | G | L | A | A | P | Q | I | G | I | L | K | R | A | A | V | V | E |   | : |   | 3 | 0 | |
D | E | F | _ | B | O | R | B | U | | |   |   | 1 |   | : |   | K | K | M | I | E | L | M | D | I | S | G | G | V | G | L | A | A | P | Q | V | G | L | D | L | A | L | F | V | V | R |   | : |   | 3 | 0 | |
D | E | F | _ | B | U | C | A | I | | |   |   | 1 |   | : |   | N | D | M | I | D | T | M | Y | Q | E | E | G | I | G | L | A | A | T | Q | V | N | I | P | L | Q | I | I | V | V | N |   | : |   | 3 | 0 | |
D | E | F | _ | C | H | L | M | U | | |   |   | 1 |   | : |   | L | D | M | S | E | T | M | T | F | Y | K | G | V | G | L | A | A | P | Q | V | G | H | S | V | A | L | F | I | M | G |   | : |   | 3 | 0 | |
D | E | F | _ | C | H | L | P | N | | |   |   | 1 |   | : |   | S | D | M | C | D | T | M | E | A | H | R | G | V | G | L | A | A | P | Q | V | G | K | N | V | S | L | F | V | M | C |   | : |   | 3 | 0 | |
D | E | F | _ | C | H | L | T | R | | |   |   | 1 |   | : |   | L | D | M | S | E | T | M | A | F | Y | K | G | V | G | L | A | A | P | Q | V | G | Q | S | I | S | L | F | I | M | G |   | : |   | 3 | 0 | |
D | E | F | _ | C | L | O | A | B | | |   |   | 1 |   | : |   | D | D | M | F | E | T | M | Y | N | A | D | G | V | G | L | A | A | P | Q | V | G | I | L | K | R | L | V | V | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | E | C | O | L | I | | |   |   | 1 |   | : |   | D | D | M | F | E | T | M | Y | A | E | E | G | I | G | L | A | A | T | Q | V | D | I | H | Q | R | I | I | V | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | F | R | E | D | I | | |   |   | 1 |   | : |   | R | D | M | L | Q | T | M | Y | S | K | D | G | I | G | L | A | A | P | Q | V | G | I | H | K | Q | L | I | V | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | H | A | E | I | N | | |   |   | 1 |   | : |   | D | D | M | F | D | T | M | Y | Q | E | K | G | I | G | L | A | A | P | Q | V | D | I | L | Q | R | I | I | T | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | H | E | L | P | J | | |   |   | 1 |   | : |   | D | D | M | H | E | T | M | I | A | S | E | G | I | G | L | A | A | I | Q | V | G | L | P | L | R | M | L | I | I | N |   | : |   | 3 | 0 | |
D | E | F | _ | H | E | L | P | Y | | |   |   | 1 |   | : |   | D | D | M | H | E | T | M | I | A | S | E | G | I | G | L | A | A | I | Q | V | G | L | P | L | R | M | L | I | I | N |   | : |   | 3 | 0 | |
D | E | F | _ | L | A | C | L | A | | |   |   | 1 |   | : |   | P | V | M | A | E | K | M | G | L | R | G | G | V | G | L | A | A | N | Q | L | G | L | L | K | K | V | I | A | V | L |   | : |   | 3 | 0 | |
D | E | F | _ | M | Y | C | G | E | | |   |   | 1 |   | : |   | D | G | K | A | Q | E | Y | D | I | I | P | G | I | G | I | A | A | N | Q | I | G | Y | W | K | Q | L | F | Y | I | H |   | : |   | 3 | 0 | |
D | E | F | _ | M | Y | C | P | N | | |   |   | 1 |   | : |   | N | G | D | A | E | K | Y | G | I | I | P | G | I | G | I | A | A | N | Q | I | G | Y | W | K | Q | M | F | Y | I | H |   | : |   | 3 | 0 | |
D | E | F | _ | M | Y | C | T | U | | |   |   | 1 |   | : |   | A | T | M | Y | D | T | M | D | A | A | N | G | V | G | L | A | A | N | Q | I | G | C | S | L | R | L | F | V | Y | D |   | : |   | 3 | 0 | |
D | E | F | _ | P | A | S | M | U | | |   |   | 1 |   | : |   | D | N | M | F | E | T | M | Y | L | E | E | G | I | G | L | A | A | T | Q | V | N | I | H | Q | R | I | I | T | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | R | I | C | P | R | | |   |   | 1 |   | : |   | H | D | M | L | E | T | M | Y | N | A | D | G | A | G | L | A | A | V | Q | V | G | I | L | L | R | I | L | V | I | D |   | : |   | 3 | 0 | |
D | E | F | _ | S | T | R | C | O | | |   |   | 1 |   | : |   | D | D | M | F | R | T | M | Y | V | A | E | G | A | G | L | A | A | N | Q | V | G | V | D | L | R | L | F | V | Y | D |   | : |   | 3 | 0 | |
D | E | F | _ | S | Y | N | Y | 3 | | |   |   | 1 |   | : |   | K | E | M | L | Q | T | M | Y | S | A | N | G | I | G | L | A | A | P | Q | V | G | I | N | K | Q | L | L | V | V | D |   | : |   | 3 | 0 | |
D | E | F | _ | T | H | E | M | A | | |   |   | 1 |   | : |   | E | R | M | I | E | T | M | Y | H | Y | D | G | V | G | L | A | A | P | Q | V | G | I | S | Q | R | F | F | V | M | D |   | : |   | 3 | 0 | |
D | E | F | _ | T | H | E | T | H | | |   |   | 1 |   | : |   | E | D | M | L | E | T | M | F | E | A | K | G | V | G | L | A | A | P | Q | I | G | L | S | Q | R | L | F | V | A | V |   | : |   | 3 | 0 | |
D | E | F | _ | T | R | E | P | A | | |   |   | 1 |   | : |   | S | G | M | F | R | V | M | R | G | A | G | G | V | G | L | A | A | P | Q | V | G | R | T | V | R | V | F | V | V | D |   | : |   | 3 | 0 | |
Q | 9 | 9 | X | Y | 7 | | | 5 | 9 |   |   |   | 1 |   | : |   | P | V | M | A | E | K | L | G | L | R | A | G | V | G | L | A | A | P | Q | I | D | V | S | K | R | I | I | A | V | L |   | : |   | 3 | 0 | |
Q | 9 | A | B | F | 5 | | | 3 | 7 |   |   |   | 1 |   | : |   | D | D | M | L | E | T | M | Y | D | A | P | G | I | G | L | A | A | V | Q | V | G | E | P | V | R | V | I | V | M | D |   | : |   | 3 | 0 | |
Q | 9 | C | B | I | 2 | | | 3 | 8 |   |   |   | 1 |   | : |   | S | T | M | Y | D | T | M | D | A | A | H | G | V | G | L | A | A | N | Q | I | G | Y | G | L | R | V | F | V | Y | D |   | : |   | 3 | 0 | |
Q | 9 | F | 2 | F | 0 | | | 5 | 9 |   |   |   | 1 |   | : |   | P | V | M | A | E | K | M | G | L | R | G | G | V | G | L | A | A | P | Q | L | D | I | S | K | R | I | I | A | V | L |   | : |   | 3 | 0 | |
Q | 9 | F | 4 | L | 4 | | | 4 | 7 |   |   |   | 1 |   | : |   | E | E | I | A | K | R | Y | G | L | R | S | G | V | G | L | A | A | P | Q | I | N | I | S | K | R | M | I | A | V | L |   | : |   | 3 | 0 | |
Q | 9 | F | C | A | 2 | | | 8 | 1 |   |   |   | 1 |   | : |   | E | D | L | F | A | T | M | Y | A | A | H | G | V | G | L | A | A | N | Q | V | G | E | A | V | R | V | F | V | Y | D |   | : |   | 3 | 0 | |
Q | 9 | F | U | Z | 0 | | | 1 | 2 | 1 |   |   | 1 |   | : |   | E | E | M | V | K | V | M | R | N | A | P | G | V | G | L | A | A | P | Q | I | G | I | P | L | K | I | I | V | L | E |   | : |   | 3 | 0 | |
Q | 9 | F | U | Z | 2 | | | 1 | 1 | 0 |   |   | 1 |   | : |   | D | A | M | F | D | V | M | Y | K | T | D | G | I | G | L | S | A | P | Q | V | G | L | N | V | Q | L | M | V | F | N |   | : |   | 3 | 0 | |
Q | 9 | F | V | 5 | 3 | | | 1 | 1 | 3 |   |   | 1 |   | : |   | D | D | M | I | K | V | M | R | L | A | P | G | V | G | L | A | A | P | Q | I | G | V | P | L | R | I | I | V | L | E |   | : |   | 3 | 0 | |
Q | 9 | F | V | 5 | 4 | | | 1 | 1 | 6 |   |   | 1 |   | : |   | D | E | M | F | D | I | M | Y | K | T | D | G | I | G | L | S | A | P | Q | V | G | M | N | V | Q | L | M | V | F | N |   | : |   | 3 | 0 | |
Q | 9 | H | B | H | 1 | | | 9 | 7 |   |   |   | 1 |   | : |   | Q | R | L | V | Q | V | M | R | R | R | R | C | V | G | L | S | A | P | Q | L | G | V | P | R | Q | V | L | A | L | E |   | : |   | 3 | 0 | |
Q | 9 | I | 7 | A | 8 | | | 3 | 3 |   |   |   | 1 |   | : |   | D | D | M | F | E | T | M | Y | E | A | P | G | I | G | L | A | A | T | Q | V | N | V | H | K | R | I | V | V | M | D |   | : |   | 3 | 0 | |
Q | 9 | J | Q | N | 0 | | | 3 | 3 |   |   |   | 1 |   | : |   | A | D | M | F | E | T | M | Y | E | S | R | G | I | G | L | A | A | T | Q | V | D | V | H | E | R | V | V | V | M | D |   | : |   | 3 | 0 | |
Q | 9 | K | 4 | A | 0 | | | 7 | 1 |   |   |   | 1 |   | : |   | A | D | M | F | A | S | Q | R | T | A | E | G | V | G | L | A | A | N | Q | I | G | V | S | K | K | V | F | V | Y | D |   | : |   | 3 | 0 | |
Q | 9 | K | 9 | I | 9 | | | 4 | 7 |   |   |   | 1 |   | : |   | P | E | I | A | E | K | Y | S | L | R | P | G | V | G | L | A | A | P | Q | I | G | L | S | K | Q | M | I | A | V | H |   | : |   | 3 | 0 | |
Q | 9 | K | N | 1 | 6 | | | 3 | 3 |   |   |   | 1 |   | : |   | D | L | L | D | T | L | Y | A | T | D | N | G | I | G | L | A | A | P | Q | V | G | R | E | E | A | I | V | V | I | D |   | : |   | 3 | 0 | |
Q | 9 | K | V | U | 3 | | | 3 | 3 |   |   |   | 1 |   | : |   | D | D | M | L | E | T | M | Y | A | E | E | G | I | G | L | A | A | T | Q | V | D | I | H | Q | R | I | V | V | I | D |   | : |   | 3 | 0 | |
Q | 9 | K | X | 6 | 3 | | | 5 | 9 |   |   |   | 1 |   | : |   | D | D | N | A | E | K | Y | D | I | R | P | G | I | G | I | A | A | N | Q | L | G | L | N | Q | R | F | F | Y | V | H |   | : |   | 3 | 0 | |
Q | 9 | L | Y | J | 4 | | | 1 | 1 | 0 |   |   | 1 |   | : |   | D | A | M | F | D | V | M | Y | K | T | D | G | I | G | L | S | A | P | Q | V | G | L | N | V | Q | L | M | V | F | N |   | : |   | 3 | 0 | |
Q | 9 | P | E | V | 2 | | | 3 | 6 |   |   |   | 1 |   | : |   | D | D | M | F | E | T | M | Y | A | A | P | G | I | G | L | A | A | T | Q | V | N | V | H | Q | R | F | M | V | I | D |   | : |   | 3 | 0 | |
Q | 9 | P | I | T | 8 | | | 3 | 2 |   |   |   | 1 |   | : |   | D | D | M | Y | E | T | M | I | A | S | N | G | V | G | L | A | A | I | Q | V | D | I | P | L | R | V | L | L | V | N |   | : |   | 3 | 0 | |
Q | 9 | P | Q | 2 | 5 | | | 6 | 1 |   |   |   | 1 |   | : |   | H | N | Q | A | K | K | Y | K | I | R | S | G | I | A | I | A | A | N | Q | V | G | W | N | K | R | A | T | Y | I | H |   | : |   | 3 | 0 | |
Q | 9 | R | D | 2 | 7 | | | 5 | 5 |   |   |   | 1 |   | : |   | E | A | L | R | L | T | M | H | A | A | P | G | V | G | L | A | A | P | Q | V | G | V | G | L | R | V | A | V | I | E |   | : |   | 3 | 0 | |
Q | 9 | R | E | Q | 2 | | | 3 | 3 |   |   |   | 1 |   | : |   | D | D | M | F | E | T | M | Y | K | A | P | G | I | G | L | A | A | I | Q | V | G | V | A | K | R | L | L | V | I | D |   | : |   | 3 | 0 | |
Q | 9 | R | R | Q | 4 | | | 6 | 0 |   |   |   | 1 |   | : |   | D | T | M | L | E | T | M | F | E | E | R | G | V | G | L | A | A | P | Q | I | G | L | P | V | R | M | F | V | A | V |   | : |   | 3 | 0 | |
Q | 9 | V | G | Y | 2 | | | 3 | 9 |   |   |   | 1 |   | : |   | D | G | M | V | K | V | L | R | H | Y | D | C | V | G | V | A | A | P | Q | V | G | I | P | L | R | I | I | V | M | E |   | : |   | 3 | 0 | |
Q | 9 | X | I | 3 | 0 | | | 1 | 0 | 3 |   |   | 1 |   | : |   | D | D | M | I | K | V | M | R | L | A | P | G | V | G | L | A | A | P | Q | I | G | V | P | L | R | I | I | V | L | E |   | : |   | 3 | 0 | |
Q | 9 | Z | A | W | 6 | | | 3 | 3 |   |   |   | 1 |   | : |   | D | D | M | Y | E | T | M | I | A | S | E | G | I | G | L | A | A | I | Q | V | G | L | P | L | R | M | L | I | I | N |   | : |   | 3 | 0 | |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | m |   |   |   | m |   |   |   |   | G |   | G | L | A | A |   | Q | v | g |   |   |   | r |   |   | v |   |   |   |   |   |   |   |
Пара аминокислот | nαβ | pαβ | qα | qβ | sαβ |
Глицин, Аланин | 94 | 0,00237 | 0,102 | 0,07829 | -5,5073 |
Глицин,Глицин | 3244 | 0,0817 | 0,102 | 0,102 | 5,9474 |
Глицин, Аспарагин | 326 | 0,00821 | 0,102 | 0,03096 | 0,75755 |
С помощью программы pairs_count.exe были посчитаны количества всех возможных пар аминокислот (nαβ) и суммарное количество пар (N=230824881) . Далее были посчитаны доли каждой пары аминокислот по отношению к их общему количеству. Эту величину мы обозначили pαβ. Далее были посчитаны частоты встречаемости аминокислот qα. В итоге, мы пришли к весам аминокислотных замен (sαβ).
Все это посчитано по формулам:
pαβ=nαβ/N; qα=pαα+ (pαβ+pαγ+...)/2; sαβ=2log2(pαβ/(2*qα*qβ)); sαα=2log2(pαα/qα2)
Пара аминокислот | nαβ | pαβ | qα | qβ | sαβ |
Глицин, Аланин | 2140915 | 0,009342 | 0,070826 | 0,078016 | -0,48476 |
Глицин, Глицин | 7449873 | 0,032508 | 0,070826 | 0,070826 | 5,392207 |
Глицин, Аспарагин | 1402318 | 0,006119 | 0,070826 | 0,034191 | 0,674724 |
Пара аминокислот | Блок PR01576A | 200 блоков | BLOSUM62 |
Глицин, Аланин | -6 | 0 | 0 |
Глицин,Глицин | 3 | 5 | 6 |
Глицин, Аспарагин | 1 | 1 | 0 |