НА ГЛАВНУЮ

Cравнение аминокислотных
последовательностей белков
и нуклеотидных последовательностей
соответствующих генов

Последовательности гомологов моего белка и их генов
были найдены с помощью BLAST-сервера EBI.

Наблюдение элементарных эволюционных
событий в ближайших гомологах

Выравнивания белка PDXH_ECOLI и его ближайшего гомолога
получены программой needle и обработаны в Genedoc .

В итоге можно сделать вывод, что:

  • Из восьми нуклеотидных замен к аминокислотной мутации привела только одна;
  • при этом семь оставшихся (синонимичных) — в третьих позициях;
  • несинонимичная замена произошла во второй позиции;
  • соотношение синонимичных и несинонимичных замен 7 к 1.

Матрица замен нуклеотидов:

  A T G C
A ? 0 3 0
T   ? 1 3
G     ? 1
C       ?

Из таблицы видно, что пуриновые основания чаще заменяются
на пуриновые, а пиримидиновые — на пиримидиновые.

Выравнивание белковой последовательности:
                                                                                                                                                             
                                            *                 2 0                   *                 4 0                   *                 6 0            
P D X H _ E C O L I   :   ~ S D N D E L Q Q I A H L R R E Y T K G G L R R R D L P A D P L T L F E R W L S Q A C E A K L A D P T A M V V A T V D E   :     5 9
Q 3 Z 1 Z 4 _ S H I   :   M S D N D E L Q Q I A H L R R E Y T K G G L R R R D L P A D P L T L F E R W L S Q A C E A K L A D P T A M V V A T V D E   :     6 0
                            S D N D E L Q Q I A H L R R E Y T K G G L R R R D L P A D P L T L F E R W L S Q A C E A K L A D P T A M V V A T V D E            
                                                                                                                                                             
                                            *                 8 0                   *               1 0 0                   *               1 2 0            
P D X H _ E C O L I   :   H G Q P Y Q R I V L L K H Y D E K G M V F Y T N L G S R K A H Q I E N N P R V S L L F P W H T L E R Q V M V I G K A E R   :   1 1 9
Q 3 Z 1 Z 4 _ S H I   :   H A Q P Y Q R I V L L K H Y D E K G M V F Y T N L G S R K A H Q I E N N P R V S L L F P W H T L E R Q V M V I G K A E R   :   1 2 0
                          H   Q P Y Q R I V L L K H Y D E K G M V F Y T N L G S R K A H Q I E N N P R V S L L F P W H T L E R Q V M V I G K A E R            
                                                                                                                                                             
                                            *               1 4 0                   *               1 6 0                   *               1 8 0            
P D X H _ E C O L I   :   L S T L E V M K Y F H S R P R D S Q I G A W V S K Q S S R I S A R G I L E S K F L E L K Q K F Q Q G E V P L P S F W G G   :   1 7 9
Q 3 Z 1 Z 4 _ S H I   :   L S T L E V M K Y F H S R P R D S Q I G A W V S K Q S S R I S A R G I L E S K F L E L K Q K F Q Q G E V P L P S F W G G   :   1 8 0
                          L S T L E V M K Y F H S R P R D S Q I G A W V S K Q S S R I S A R G I L E S K F L E L K Q K F Q Q G E V P L P S F W G G            
                                                                                                                 
                                            *               2 0 0                   *                            
P D X H _ E C O L I   :   F R V S L E Q I E F W Q G G E H R L H D R F L Y Q R E N D A W K I D R L A P   :   2 1 7
Q 3 Z 1 Z 4 _ S H I   :   F R V S L E Q I E F W Q G G E H R L H D R F L Y Q R E N D A W K I D R L A P   :   2 1 8
                          F R V S L E Q I E F W Q G G E H R L H D R F L Y Q R E N D A W K I D R L A P            

Выравнивание нуклеотидной последовательности
(кодоны, в которых произошли замены, отмечены крестиками):
                                                                                                                                                         
                                        *                 2 0                   *                 4 0                   *                 6 0            
B A A 1 5 3 9 9   :   ~ ~ ~ t c t g a t a a c g a c g a a t t g c a g c a a a t c g c g c a t c t g c g c c g t g a a t a c a c c a a a g g c   :     5 7
A A Z 8 8 2 1 8   :   a t g t c t g a t a a c g a c g a a t t g c a g c a a a t c g c g c a t c t g c g c c g t g a a t a c a c c a a a g g c   :     6 0
                            T C T G A T A A C G A C G A A T T G C A G C A A A T C G C G C A T C T G C G C C G T G A A T A C A C C A A A G G C            
                                                                                                                                                         
                                        + + +             8 0                   *               1 0 0                   *               1 2 0            
B A A 1 5 3 9 9   :   g g g t t a c g c c g c c g c g a t c t t c c c g c c g a t c c a t t a a c c c t t t t t g a a c g t t g g c t c t c t   :   1 1 7
A A Z 8 8 2 1 8   :   g g g t t a c g c c g t c g c g a t c t t c c c g c c g a t c c a t t a a c c c t t t t t g a a c g t t g g c t c t c t   :   1 2 0
                      G G G T T A C G C C G   C G C G A T C T T C C C G C C G A T C C A T T A A C C C T T T T T G A A C G T T G G C T C T C T            
                                                                                                                                                         
                            + + +       *               1 4 0   + + +           *               1 6 0                   *               1 8 0            
B A A 1 5 3 9 9   :   c a g g c t t g t g a a g c c a a a c t g g c g g a c c c t a c c g c g a t g g t g g t c g c t a c c g t g g a t g a a   :   1 7 7
A A Z 8 8 2 1 8   :   c a g g c g t g t g a a g c c a a a c t g g c a g a c c c t a c c g c g a t g g t g g t c g c t a c c g t g g a t g a a   :   1 8 0
                      C A G G C   T G T G A A G C C A A A C T G G C   G A C C C T A C C G C G A T G G T G G T C G C T A C C G T G G A T G A A            
                                                                                                                                                         
                            + + +       *           + + +                       *               2 2 0                   *               2 4 0            
B A A 1 5 3 9 9   :   c a t g g t c a g c c t t a t c a g c g c a t c g t t t t a c t c a a a c a t t a c g a c g a a a a a g g c a t g g t g   :   2 3 7
A A Z 8 8 2 1 8   :   c a t g c t c a g c c t t a t c a a c g c a t c g t t t t a c t c a a a c a t t a c g a c g a a a a a g g c a t g g t g   :   2 4 0
                      C A T G   T C A G C C T T A T C A   C G C A T C G T T T T A C T C A A A C A T T A C G A C G A A A A A G G C A T G G T G            
                                                                                                                                                         
                                        *               2 6 0                   *             + + +                     *               3 0 0            
B A A 1 5 3 9 9   :   t t t t a c a c c a a c c t c g g c a g c c g t a a a g c a c a t c a a a t c g a a a a t a a t c c g c g c g t t a g c   :   2 9 7
A A Z 8 8 2 1 8   :   t t t t a c a c c a a c c t c g g c a g c c g t a a a g c a c a t c a a a t t g a a a a t a a t c c g c g c g t t a g c   :   3 0 0
                      T T T T A C A C C A A C C T C G G C A G C C G T A A A G C A C A T C A A A T   G A A A A T A A T C C G C G C G T T A G C            
                                                                                                                                                         
                                        *               3 2 0                   *               3 4 0                   *   + + +       3 6 0            
B A A 1 5 3 9 9   :   c t g c t g t t c c c g t g g c a t a c c c t t g a g c g c c a g g t g a t g g t g a t c g g t a a a g c a g a a c g a   :   3 5 7
A A Z 8 8 2 1 8   :   c t g c t g t t c c c g t g g c a t a c c c t t g a g c g c c a g g t g a t g g t g a t c g g t a a a g c g g a a c g a   :   3 6 0
                      C T G C T G T T C C C G T G G C A T A C C C T T G A G C G C C A G G T G A T G G T G A T C G G T A A A G C   G A A C G A            
                                                                                                                                                         
                                        *               3 8 0                   *               4 0 0                   *               4 2 0            
B A A 1 5 3 9 9   :   c t t t c g a c t c t c g a a g t g a t g a a a t a t t t t c a t a g c c g c c c g c g t g a t a g c c a g a t t g g t   :   4 1 7
A A Z 8 8 2 1 8   :   c t t t c g a c t c t c g a a g t g a t g a a a t a t t t t c a t a g c c g c c c g c g t g a t a g c c a g a t t g g t   :   4 2 0
                      C T T T C G A C T C T C G A A G T G A T G A A A T A T T T T C A T A G C C G C C C G C G T G A T A G C C A G A T T G G T            
                                                                                                                                                         
                                        *               4 4 0                   *               4 6 0                   *               4 8 0            
B A A 1 5 3 9 9   :   g c a t g g g t t t c g a a g c a g t c c a g t c g c a t t t c t g c c c g c g g t a t c c t t g a a a g t a a a t t c   :   4 7 7
A A Z 8 8 2 1 8   :   g c a t g g g t t t c g a a g c a g t c c a g t c g c a t t t c t g c c c g c g g t a t c c t t g a a a g t a a a t t c   :   4 8 0
                      G C A T G G G T T T C G A A G C A G T C C A G T C G C A T T T C T G C C C G C G G T A T C C T T G A A A G T A A A T T C            
                                                                                                                                                         
                                        *               5 0 0                   *               5 2 0                   *               5 4 0            
B A A 1 5 3 9 9   :   c t g g a g c t g a a g c a g a a g t t t c a a c a g g g c g a a g t g c c a t t g c c g a g c t t t t g g g g c g g t   :   5 3 7
A A Z 8 8 2 1 8   :   c t g g a g c t g a a g c a g a a g t t t c a a c a g g g c g a a g t g c c a t t g c c g a g c t t t t g g g g c g g t   :   5 4 0
                      C T G G A G C T G A A G C A G A A G T T T C A A C A G G G C G A A G T G C C A T T G C C G A G C T T T T G G G G C G G T            
                                                                                                                                                         
                                        *               5 6 0                   *             + + +                     *               6 0 0            
B A A 1 5 3 9 9   :   t t t c g c g t c a g c c t t g a a c a g a t t g a g t t c t g g c a g g g t g g t g a g c a t c g c c t g c a t g a c   :   5 9 7
A A Z 8 8 2 1 8   :   t t t c g c g t c a g c c t t g a a c a g a t t g a g t t c t g g c a g g g c g g t g a g c a t c g c c t g c a t g a c   :   6 0 0
                      T T T C G C G T C A G C C T T G A A C A G A T T G A G T T C T G G C A G G G   G G T G A G C A T C G C C T G C A T G A C            
                                                                                                                                                   
                                        *               6 2 0                   *               6 4 0                   *                          
B A A 1 5 3 9 9   :   c g c t t t t t g t a c c a g c g t g a a a a t g a t g c g t g g a a g a t t g a t c g t c t t g c a c c c t g a   :   6 5 4
A A Z 8 8 2 1 8   :   c g c t t t t t g t a c c a g c g t g a a a a t g a t g c g t g g a a g a t t g a t c g t c t t g c a c c c t g a   :   6 5 7
                      C G C T T T T T G T A C C A G C G T G A A A A T G A T G C G T G G A A G A T T G A T C G T C T T G C A C C C T G A            

Исследование зависимости процента
совпадений последовательностей белков
от процента совпадений
последовательностей их генов.

Проценты совпадений последовательностей были получены с помощью скрипта.
По этим данным был построен график в Exel .
Ниже приведены два графика: полученный мной и график,
показывающий связь процентов совпадений последовательностей
для белка-предшественника гемагглютинина у разных штаммов
вируса гриппа.

Эти графики похожи. Значиткльная разница наблюдается
лишь при высокой идентичности: точка (90;80) на первом
и (88;90) на втором графике. То есть к мутации приводила
каждая третья нуклеотидная замена и даже чуть чаще. Могу
предположить, что разница возникла из-за действия на белок
гемагглютинина движущего отбора (белок изменяется, чтобы на
него не действовали антитела к другим видам этого же белка),
тогда как на PDXH действует в основном стабилизирующий
отбор. Но тогда не очень понятно, почему различие для
других точек графика меньше.

Этот график — также про гемагглютинин, только
построен по большему числу точек.