Главная страница третьего семестра

Сравнение аминокислотных последовательностей гомологов PHOQ_ECOLI и нуклеотидных последовательностей их генов

    Поиск гомологов белка PHOQ_ECOLI проводился с помощью BLAST-сервера EBI по базе данных Uniprot. Было выбрано 6 белков из банка данных с разной степенью сходства с последовательностью белка PHOQ_ECOLI. Из базы данных кодирующих последовательностей EMBLCDS были отобраны соответствующие им гены. При отборе было важно, чтобы последовательности выравнивались друг с другом по возможности по всей длине, чего не гарантировал BLAST, ведущий поиск, составляя локальные выравнивания.

Белки, включённые в выборку

Идентификатор белка Идентификатор гена
P23837 (PHOQ_ECOLI) BAA14391
Q8X739 BAB35024
P14147 AJ272210.1
Q93TP8 AAM85361.1
Q93TP9 AAK54057.1
O85059 AAC38776.1
Q3K8C8 ABA75976.1
   Примечание: белки и гены в таблице отсортированы по проценту сходства белков в локальном выравнивании, проведённом с помощью BLAST. Таким образом, ближайшим гомологом к белку FHUA_ECOLI будет белок, указанный в таблице во второй строчке.

Наблюдение элементарных эволюционных событий в ближайших гомологах

   Программой needle были построены глобальные выравнивания белков и генов PHOQ_ECOLI и его самого близкого гомолога Q8X739. Было изучено количество аминокислотных и нуклеотидных замен в последовательностях. Белки имеют равное число аминокислот в своих последовательностях, а их гены — равное количество нуклеотидов.

Выравнивание аминокислотных последовательностей

                                                                                                                                                                                                           
                                    *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                          
P 2 3 8 3 7   :   M K K L L R L F F P L S L R V R F L L A T A A V V L V L S L A Y G M V A L I G Y S V S F D K T T F R L L R G E S N L F Y T L A K W E N N K L H V E L P E N I D K Q S P T M T L   :     8 7
Q 8 X 7 3 9   :   M K K L L H L F F P L S L R V R F L L A T A A V V L V L S L A Y G M V A L I G Y S V S F D K T T F R L L R G E S N L F Y T L A K W E N N K L H V E L P E N I D K Q S P T M T L   :     8 7
                  M K K L L   L F F P L S L R V R F L L A T A A V V L V L S L A Y G M V A L I G Y S V S F D K T T F R L L R G E S N L F Y T L A K W E N N K L H V E L P E N I D K Q S P T M T L            
                                                                                                                                                                                                           
                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                   *                    
P 2 3 8 3 7   :   I Y D E N G Q L L W A Q R D V P W L M K M I Q P D W L K S N G F H E I E A D V N D T S L L L S G D H S I Q Q Q L Q E V R E D D D D A E M T H S V A V N V Y P A T S R M P K L T   :   1 7 4
Q 8 X 7 3 9   :   I Y D E N G Q L L W A Q R D V P W L M K M I Q P D W L K S N G F H E I E A D V N D T S L L L S G D H S I Q Q Q L Q E V R E D D D D A E M T H S V A V N V Y P A T S R M P K L T   :   1 7 4
                  I Y D E N G Q L L W A Q R D V P W L M K M I Q P D W L K S N G F H E I E A D V N D T S L L L S G D H S I Q Q Q L Q E V R E D D D D A E M T H S V A V N V Y P A T S R M P K L T            
                                                                                                                                                                                                           
                        1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                   *               2 6 0              
P 2 3 8 3 7   :   I V V V D T I P V E L K S S Y M V W S W F I Y V L S A N L L L V I P L L W V A A W W S L R P I E A L A K E V R E L E E H N R E L L N P A T T R E L T S L V R N L N R L L K S E   :   2 6 1
Q 8 X 7 3 9   :   I V V V D T I P V E L K S S Y M V W S W F I Y V L S A N L L L V I P L L W V A A W W S L R P I E A L A K E V R E L E E H N R E L L N P A T T R E L T S L V R N L N R L L K S E   :   2 6 1
                  I V V V D T I P V E L K S S Y M V W S W F I Y V L S A N L L L V I P L L W V A A W W S L R P I E A L A K E V R E L E E H N R E L L N P A T T R E L T S L V R N L N R L L K S E            
                                                                                                                                                                                                           
                                  *               2 8 0                   *               3 0 0                   *               3 2 0                   *               3 4 0                            
P 2 3 8 3 7   :   R E R Y D K Y R T T L T D L T H S L K T P L A V L Q S T L R S L R S E K M S V S D A E P V M L E Q I S R I S Q Q I G Y Y L H R A S M R G G T L L S R E L H P V A P L L D N L T   :   3 4 8
Q 8 X 7 3 9   :   R E R Y D K Y R T T L T D L T H S L K T P L A V L Q S T L R S L R S E K M S V S D A E P V M L E Q I S R I S Q Q I G Y Y L H R A S M H G G T L L S R E L H P V A P L L D N L T   :   3 4 8
                  R E R Y D K Y R T T L T D L T H S L K T P L A V L Q S T L R S L R S E K M S V S D A E P V M L E Q I S R I S Q Q I G Y Y L H R A S M   G G T L L S R E L H P V A P L L D N L T            
                                                                                                                                                                                                           
                    *               3 6 0                   *               3 8 0                   *               4 0 0                   *               4 2 0                   *                      
P 2 3 8 3 7   :   S A L N K V Y Q R K G V N I S L D I S P E I S F V G E Q N D F V E V M G N V L D N A C K Y C L E F V E I S A R Q T D E H L Y I V V E D D G P G I P L S K R E V I F D R G Q R V   :   4 3 5
Q 8 X 7 3 9   :   S A L N K V Y Q R K G V N I S L D I S P E I S F V G E Q N D F V E V M G N V L D N A C K Y C L E F V E I S A R Q T D E H L Y I V V E D D G P G I P L S K R E V I F D R G Q R V   :   4 3 5
                  S A L N K V Y Q R K G V N I S L D I S P E I S F V G E Q N D F V E V M G N V L D N A C K Y C L E F V E I S A R Q T D E H L Y I V V E D D G P G I P L S K R E V I F D R G Q R V            
                                                                                                                                   
                      4 4 0                   *               4 6 0                   *               4 8 0                        
P 2 3 8 3 7   :   D T L R P G Q G V G L A V A R E I T E Q Y E G K I V A G E S M L G G A R M E V I F G R Q H S A P K D E   :   4 8 6
Q 8 X 7 3 9   :   D T L R P G Q G V G L A V A R E I T K Q Y E G K I V A G E S M L G G A R M E V I F G R Q H S T P K D E   :   4 8 6
                  D T L R P G Q G V G L A V A R E I T   Q Y E G K I V A G E S M L G G A R M E V I F G R Q H S   P K D E            

Таблица несовпадений в белковых последовательностях

Номер позиции Аминокислота в PHOQ_ECOLI Аминокислота в гомологе Q8X739
6 R H
328 R H
454 E K
482 A T

   Затем была построена аналогичная таблица для нуклеотидов и исследована зависимость нуклеотидных замен от белковых. При сопоставлении замен был использован стандартный генетический код.

Выравнивание нуклеотидных последовательностей

                                                                                                                                                                                                       
                                        *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
B A A 1 4 3 9 1   :   a t g a a a a a a t t a c t g c g t c t t t t t t t c c c g c t c t c g c t g c g g g t a c g t t t t c t g t t g g c a a c g g c a g c g g t a g t a c t g g t g c   :       8 2
B A B 3 5 0 2 4   :   a t g a a a a a a t t a c t g c a t c t t t t t t t c c c g c t c t c g c t g c g g g t a c g t t t t c t g t t g g c a a c g g c a g c g g t a g t a c t g g t g c   :       8 2
                      A T G A A A A A A T T A C T G C   T C T T T T T T T C C C G C T C T C G C T G C G G G T A C G T T T T C T G T T G G C A A C G G C A G C G G T A G T A C T G G T G C              
                                                                                                                                                                                                       
                                    *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                      
B A A 1 4 3 9 1   :   t t t c g c t t g c c t a c g g a a t g g t c g c g c t g a t c g g t t a t a g c g t c a g t t t c g a t a a a a c t a c g t t t c g g c t g t t a c g t g g c g a   :     1 6 4
B A B 3 5 0 2 4   :   t t t c g c t t g c c t a c g g a a t g g t c g c g c t g a t c g g t t a t a g c g t c a g t t t c g a t a a a a c t a c g t t t c g g c t g t t a c g t g g c g a   :     1 6 4
                      T T T C G C T T G C C T A C G G A A T G G T C G C G C T G A T C G G T T A T A G C G T C A G T T T C G A T A A A A C T A C G T T T C G G C T G T T A C G T G G C G A              
                                                                                                                                                                                                       
                                *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                          
B A A 1 4 3 9 1   :   g a g c a a t c t g t t c t a t a c c c t t g c g a a g t g g g a a a a c a a t a a g t t g c a t g t c g a g t t a c c c g a a a a t a t c g a c a a g c a a a g c   :     2 4 6
B A B 3 5 0 2 4   :   g a g c a a t c t g t t c t a t a c c c t t g c g a a g t g g g a a a a c a a t a a g t t g c a t g t c g a g t t a c c c g a a a a t a t c g a c a a g c a a a g c   :     2 4 6
                      G A G C A A T C T G T T C T A T A C C C T T G C G A A G T G G G A A A A C A A T A A G T T G C A T G T C G A G T T A C C C G A A A A T A T C G A C A A G C A A A G C              
                                                                                                                                                                                                       
                            *               2 6 0                   *               2 8 0                   *               3 0 0                   *               3 2 0                              
B A A 1 4 3 9 1   :   c c c a c c a t g a c g c t a a t t t a t g a t g a g a a c g g g c a g c t t t t a t g g g c g c a a c g t g a c g t g c c c t g g c t g a t g a a g a t g a t c c   :     3 2 8
B A B 3 5 0 2 4   :   c c c a c c a t g a c g c t a a t t t a t g a t g a g a a c g g g c a g c t t t t a t g g g c g c a a c g t g a c g t g c c c t g g c t g a t g a a g a t g a t c c   :     3 2 8
                      C C C A C C A T G A C G C T A A T T T A T G A T G A G A A C G G G C A G C T T T T A T G G G C G C A A C G T G A C G T G C C C T G G C T G A T G A A G A T G A T C C              
                                                                                                                                                                                                       
                        *               3 4 0                   *               3 6 0                   *               3 8 0                   *               4 0 0                   *              
B A A 1 4 3 9 1   :   a g c c t g a c t g g c t g a a a t c g a a t g g t t t t c a t g a a a t t g a a g c g g a t g t t a a c g a t a c c a g c c t c t t g c t g a g t g g a g a t c a   :     4 1 0
B A B 3 5 0 2 4   :   a g c c t g a c t g g c t g a a a t c g a a t g g t t t t c a t g a a a t t g a a g c g g a t g t t a a c g a t a c c a g c c t c t t g c t g a g t g g a g a t c a   :     4 1 0
                      A G C C T G A C T G G C T G A A A T C G A A T G G T T T T C A T G A A A T T G A A G C G G A T G T T A A C G A T A C C A G C C T C T T G C T G A G T G G A G A T C A              
                                                                                                                                                                                                       
                                    4 2 0                   *               4 4 0                   *               4 6 0                   *               4 8 0                   *                  
B A A 1 4 3 9 1   :   t t c g a t a c a g c a a c a g t t g c a g g a a g t g c g g g a a g a t g a t g a c g a c g c g g a g a t g a c c c a c t c g g t g g c a g t a a a c g t c t a c   :     4 9 2
B A B 3 5 0 2 4   :   t t c g a t a c a g c a a c a g t t g c a g g a a g t g c g g g a a g a t g a t g a c g a c g c g g a g a t g a c c c a c t c g g t g g c g g t a a a c g t c t a c   :     4 9 2
                      T T C G A T A C A G C A A C A G T T G C A G G A A G T G C G G G A A G A T G A T G A C G A C G C G G A G A T G A C C C A C T C G G T G G C   G T A A A C G T C T A C              
                                                                                                                                                                                                       
                                5 0 0                   *               5 2 0                   *               5 4 0                   *               5 6 0                   *                      
B A A 1 4 3 9 1   :   c c g g c a a c a t c g c g g a t g c c a a a a t t a a c c a t t g t g g t g g t g g a t a c c a t t c c g g t g g a g c t a a a a a g t t c c t a t a t g g t c t   :     5 7 4
B A B 3 5 0 2 4   :   c c g g c a a c a t c g c g g a t g c c a a a g t t a a c c a t t g t g g t g g t g g a t a c c a t t c c g g t g g a g c t a a a a a g t t c c t a t a t g g t c t   :     5 7 4
                      C C G G C A A C A T C G C G G A T G C C A A A   T T A A C C A T T G T G G T G G T G G A T A C C A T T C C G G T G G A G C T A A A A A G T T C C T A T A T G G T C T              
                                                                                                                                                                                                       
                            5 8 0                   *               6 0 0                   *               6 2 0                   *               6 4 0                   *                          
B A A 1 4 3 9 1   :   g g a g c t g g t t t a t c t a t g t g c t c t c a g c c a a t c t g c t g t t a g t g a t c c c g c t g c t g t g g g t c g c c g c c t g g t g g a g t t t a c g   :     6 5 6
B A B 3 5 0 2 4   :   g g a g c t g g t t t a t c t a t g t g c t c t c a g c c a a t c t g c t g t t a g t g a t c c c g c t g c t g t g g g t c g c c g c c t g g t g g a g t t t a c g   :     6 5 6
                      G G A G C T G G T T T A T C T A T G T G C T C T C A G C C A A T C T G C T G T T A G T G A T C C C G C T G C T G T G G G T C G C C G C C T G G T G G A G T T T A C G              
                                                                                                                                                                                                       
                        6 6 0                   *               6 8 0                   *               7 0 0                   *               7 2 0                   *               7              
B A A 1 4 3 9 1   :   c c c c a t c g a a g c c c t g g c a a a a g a a g t c c g c g a a c t g g a a g a a c a t a a c c g c g a a t t g c t c a a t c c a g c c a c a a c g c g a g a a   :     7 3 8
B A B 3 5 0 2 4   :   c c c c a t c g a a g c c c t g g c a a a a g a a g t c c g c g a a c t g g a a g a a c a t a a c c g c g a a t t g c t c a a t c c a g c c a c a a c g c g a g a a   :     7 3 8
                      C C C C A T C G A A G C C C T G G C A A A A G A A G T C C G C G A A C T G G A A G A A C A T A A C C G C G A A T T G C T C A A T C C A G C C A C A A C G C G A G A A              
                                                                                                                                                                                                       
                      4 0                   *               7 6 0                   *               7 8 0                   *               8 0 0                   *               8 2 0              
B A A 1 4 3 9 1   :   c t g a c c a g t c t g g t a c g a a a c c t g a a c c g a t t g t t a a a a a g t g a a c g c g a a c g t t a c g a c a a a t a c c g t a c g a c g c t c a c c g   :     8 2 0
B A B 3 5 0 2 4   :   c t g a c c a g t c t g g t a c g a a a c c t g a a c c g a t t g t t a a a a a g t g a a c g c g a a c g t t a c g a c a a a t a t c g t a c a a c g c t c a c c g   :     8 2 0
                      C T G A C C A G T C T G G T A C G A A A C C T G A A C C G A T T G T T A A A A A G T G A A C G C G A A C G T T A C G A C A A A T A   C G T A C   A C G C T C A C C G              
                                                                                                                                                                                                       
                                        *               8 4 0                   *               8 6 0                   *               8 8 0                   *               9 0 0                  
B A A 1 4 3 9 1   :   a c c t g a c c c a t a g t c t g a a a a c g c c a c t g g c g g t g c t g c a a a g t a c g c t g c g t t c t c t g c g t a g t g a a a a g a t g a g c g t c a g   :     9 0 2
B A B 3 5 0 2 4   :   a c c t g a c c c a t a g t c t g a a a a c g c c a c t g g c g g t g c t g c a a a g t a c g c t g c g t t c t c t a c g t a g t g a a a a g a t g a g c g t c a g   :     9 0 2
                      A C C T G A C C C A T A G T C T G A A A A C G C C A C T G G C G G T G C T G C A A A G T A C G C T G C G T T C T C T   C G T A G T G A A A A G A T G A G C G T C A G              
                                                                                                                                                                                                       
                                    *               9 2 0                   *               9 4 0                   *               9 6 0                   *               9 8 0                      
B A A 1 4 3 9 1   :   t g a t g c t g a g c c g g t a a t g c t g g a g c a a a t c a g c c g c a t t t c a c a g c a a a t t g g c t a c t a c c t g c a t c g t g c c a g t a t g c g c   :     9 8 4
B A B 3 5 0 2 4   :   t g a t g c t g a a c c g g t a a t g c t g g a g c a a a t c a g c c g c a t t t c a c a g c a a a t t g g c t a c t a c c t g c a t c g t g c c a g t a t g c a c   :     9 8 4
                      T G A T G C T G A   C C G G T A A T G C T G G A G C A A A T C A G C C G C A T T T C A C A G C A A A T T G G C T A C T A C C T G C A T C G T G C C A G T A T G C   C              
                                                                                                                                                                                                       
                                *             1 0 0 0                   *             1 0 2 0                   *             1 0 4 0                   *             1 0 6 0                          
B A A 1 4 3 9 1   :   g g c g g g a c a t t g c t c a g c c g c g a g c t g c a t c c g g t c g c c c c a c t g c t g g a c a a t c t c a c c t c a g c g c t g a a c a a a g t g t a t c   :   1 0 6 6
B A B 3 5 0 2 4   :   g g c g g g a c a t t g c t c a g c c g c g a g c t g c a t c c g g t c g c c c c a c t g c t g g a c a a t c t c a c c t c g g c g c t g a a c a a a g t g t a t c   :   1 0 6 6
                      G G C G G G A C A T T G C T C A G C C G C G A G C T G C A T C C G G T C G C C C C A C T G C T G G A C A A T C T C A C C T C   G C G C T G A A C A A A G T G T A T C              
                                                                                                                                                                                                       
                            *             1 0 8 0                   *             1 1 0 0                   *             1 1 2 0                   *             1 1 4 0                              
B A A 1 4 3 9 1   :   a a c g c a a a g g g g t c a a t a t c t c t c t c g a t a t t t c g c c a g a g a t c a g c t t t g t c g g t g a g c a g a a c g a t t t t g t c g a g g t g a t   :   1 1 4 8
B A B 3 5 0 2 4   :   a a c g c a a a g g g g t c a a t a t c t c t c t c g a t a t t t c g c c a g a g a t c a g c t t t g t c g g t g a g c a g a a c g a t t t t g t c g a g g t g a t   :   1 1 4 8
                      A A C G C A A A G G G G T C A A T A T C T C T C T C G A T A T T T C G C C A G A G A T C A G C T T T G T C G G T G A G C A G A A C G A T T T T G T C G A G G T G A T              
                                                                                                                                                                                                       
                        *             1 1 6 0                   *             1 1 8 0                   *             1 2 0 0                   *             1 2 2 0                   *              
B A A 1 4 3 9 1   :   g g g c a a c g t g c t g g a t a a t g c c t g t a a a t a t t g c c t c g a g t t t g t c g a a a t t t c t g c a a g g c a a a c c g a c g a g c a t c t c t a t   :   1 2 3 0
B A B 3 5 0 2 4   :   g g g c a a t g t a c t g g a t a a t g c c t g t a a a t a t t g c c t c g a g t t t g t c g a a a t t t c t g c a a g g c a a a c c g a c g a g c a t c t c t a t   :   1 2 3 0
                      G G G C A A   G T   C T G G A T A A T G C C T G T A A A T A T T G C C T C G A G T T T G T C G A A A T T T C T G C A A G G C A A A C C G A C G A G C A T C T C T A T              
                                                                                                                                                                                                       
                                  1 2 4 0                   *             1 2 6 0                   *             1 2 8 0                   *             1 3 0 0                   *                  
B A A 1 4 3 9 1   :   a t t g t g g t c g a g g a t g a t g g c c c c g g t a t t c c a t t a a g c a a g c g a g a g g t c a t t t t c g a c c g t g g t c a a c g g g t t g a t a c t t   :   1 3 1 2
B A B 3 5 0 2 4   :   a t t g t g g t c g a g g a t g a t g g c c c c g g t a t t c c a t t a a g c a a g c g a g a g g t c a t t t t c g a c c g t g g t c a a c g g g t t g a t a c t t   :   1 3 1 2
                      A T T G T G G T C G A G G A T G A T G G C C C C G G T A T T C C A T T A A G C A A G C G A G A G G T C A T T T T C G A C C G T G G T C A A C G G G T T G A T A C T T              
                                                                                                                                                                                                       
                              1 3 2 0                   *             1 3 4 0                   *             1 3 6 0                   *             1 3 8 0                   *                      
B A A 1 4 3 9 1   :   t a c g c c c t g g g c a a g g t g t a g g g c t g g c g g t a g c c c g c g a a a t c a c c g a g c a a t a t g a g g g t a a a a t c g t c g c c g g a g a g a g   :   1 3 9 4
B A B 3 5 0 2 4   :   t a c g c c c t g g g c a a g g t g t g g g g c t g g c g g t a g c c c g c g a a a t c a c c a a g c a a t a t g a g g g t a a a a t c g t c g c c g g a g a g a g   :   1 3 9 4
                      T A C G C C C T G G G C A A G G T G T   G G G C T G G C G G T A G C C C G C G A A A T C A C C   A G C A A T A T G A G G G T A A A A T C G T C G C C G G A G A G A G              
                                                                                                                                                                         
                          1 4 0 0                   *             1 4 2 0                   *             1 4 4 0                   *             1 4 6 0                
B A A 1 4 3 9 1   :   c a t g c t g g g c g g t g c g c g g a t g g a g g t g a t t t t t g g t c g c c a g c a t t c t g c g c c g a a a g a t g a a t a a   :   1 4 6 1
B A B 3 5 0 2 4   :   c a t g c t t g g c g g t g c g c g g a t g g a g g t g a t t t t t g g t c g c c a g c a t t c t a c g c c g a a a g a t g a a t a a   :   1 4 6 1
                      C A T G C T   G G C G G T G C G C G G A T G G A G G T G A T T T T T G G T C G C C A G C A T T C T   C G C C G A A A G A T G A A T A A              

Таблица несовпадений в нуклеотидных последовательностях

Номер позиции несовпадающего нуклеотида Триплет в PHOQ_ECOLI Триплет в гомологе Комментарии
17 cgt cat Сответствует замене в 6 позиции белкового выравнивания (R,H)
480 gca gcg Синонимичная замена в третьей позиции кодона
516 aaa aag Синонимичная замена в третьей позиции кодона
804 tac tat Синонимичная замена в третьей позиции кодона
810 acg aca Синонимичная замена в третьей позиции кодона
879 ctg cta Синонимичная замена в третьей позиции кодона
912 gag gaa Синонимичная замена в третьей позиции кодона
983 cgc cac Соответствует замене в 328 позиции белкового выравнивания (R,H)
1047 tca tcg Синонимичная замена в третьей позиции кодона
1155 aac aat Синонимичная замена в третьей позиции кодона
1158 gtg gta Синонимичная замена в третьей позиции кодона
1332 gta gtg Синонимичная замена в третьей позиции кодона
1360 gag aag Соответствует замене в 454 позиции белкового выравнивания (E,K)
1401 ctg ctt Синонимичная замена в третьей позиции кодона
1444 gcg acg Соответствует замене в 482 позиции белкового выравнивания (A,T)

   Как видно, число замен нуклеотидов между близкими гомологами заметно превышает число аминокислотных замен. Причина — большая доля синонимичных замен среди общего их числа. Отношение количества синонимичных замен к несинонимичным равно 11:4. Это говорит о том, что сохранение в неприкосновенности аминокислотной последовательности было очень важным фактором для стабилизирующего естественного отбора.

Матрица нуклеотидных замен

Нуклеотиды a t g c
a 0 12 0
t 0 1 2
g 12 1 0
c 0 2 0

   Основной вывод, который можно сделать, опираясь на данные этой матрицы заключается в том, что транзиции (замены пиримидинового нуклеотида на пиримидиновый, а пуринового — на пуриновый) встречаются чаще трансверсий (остальных замен), а также то, что гомолог с очень высоким ID не самая подходящая вещь для подобного исследования.

Исследование зависимости процента совпадений последовательностей белков от процента совпадений последовательностей их генов

   Программой needle были построены попарные глобальные выравнивания белков и соответствующих им генам. Параметры для программы были взяты по умолчанию. По этим данным был построен график зависимости попарных совпадений аминокислот белков от попарных совпадений нуклеотидов генов (на рисунке слева). Этот график был сравнён с аналогичным графиком, созданным по данным белков гемагглютина гриппа (на рисунке справа).

   Данные по белку PHOQ_ECOLI и его гомологам хорошо кореллируют с данными по предшественнику гемагглютинина, а именно график находится под линией, соединяющей точки (5;25) и (100;100). То есть процент совпадений генов ниже среднего ожидаемого. Это, по-видимому, обусловлено заменами преимущественно в третьих положениях кодонов. Однако небольшое различие между графиками всё-таки есть: при проценте совпадений в генах большем 80, график для гомологов белка PHOQ_ECOLI лежит немного ниже относительно графика для вирусного белка, то есть при одинаковом проценте различий в генах, процент различий в белках у вируса больше. Это связано с тем, что вирусы обычно подвергаются давлению движущего отбора, в то время как родственные бактерии (на близкое указывает сходство их генов) обитают, скорее всего, в схожей среде, поэтому им не свойственно большое количество аминокислотных замен.














© Низамутдинов Игорь, 2004