На главную страницу третьего семестра

Cравнение аминокислотных последовательностей гомолоов FHUA_ECOLI и нуклеотидных последовательностей соответствующих генов

    Поиск гомологов белка FHUA_ECOLI проводился с помощью BLAST-сервера EBI по базе данных Uniprot. Было выбрано 6 белков из банка данных с разной степенью сходства с последовательностью белка FHUA_ECOLI. Из базы данных кодирующих последовательностей EMBLCDS были отобраны соответствующие им гены. При отборе было важно, чтобы последовательности выравнивались друг с другом по возможности по всей длине, чего не гарантировал BLAST, ведущий поиск, составляя локальные выравнивания.

Белки, включённые в выборку

Идентификатор белка Идентификатор гена
P06971 (FHUA_ECOLI) D26562.1
Q8X901 AE005174.2
O86903 Y14067.1
Q8CWD4 AE016755.1
Q3Z5K7 CP000038.1
O86424 Y14026.1
Q44KX9 AAHZ01000001.1
   Примечание: белки и гены в таблице отсортированы по проценту сходства белков в локальном выравнивании, проведённом с помощью BLAST. Таким образом, ближайшим гомологом к белку FHUA_ECOLI будет белок, указанный в таблице во второй строчке.

Наблюдение элементарных эволюционных событий в ближайших гомологах

   Программой needle были построены глобальные выравнивания белков и генов FHUA_ECOLI и его наиболее близкого гомолога (AC указан в таблице). Было изучено количество аминокислотных и нуклеотидных замен в последовательностях. Белки имеют равное число аминокислот в своих последовательностях, а их гены — равное количество нуклеотидов.

Выравнивание аминокислотных последовательностей

                                                                                                                                                                                                       
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0              
F H U A _ E C O L I   :   M A R S K T A Q P K H S L R K I A V V V A T A V S G M S V Y A Q A A V E P K E D T I T V T A A P A P Q E S A W G P A A T I A A R Q S A T G T K T D T P I Q K V P Q   :     8 1
Q 8 X 9 0 1 _ E C O   :   M A R S K T A Q P K H S L R K I A V V V A T A V S G M S V Y A Q A A V E L K E D T I T V T A A P A P Q E S A W G P A A T I A A R Q S A T G T K T D T P I Q K V P Q   :     8 1
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                          *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                
F H U A _ E C O L I   :   S I S V V T A E E M A L H Q P K S V K E A L S Y T P G V S V G T R G A S N T Y D H L I I R G F A A E G Q S Q N N Y L N G L K L Q G N F Y N D A V I D P Y M L E R A   :   1 6 2
Q 8 X 9 0 1 _ E C O   :   S I S V V T A E E M A L H Q P K S V K E A L S Y T P G V S V G T R G A S N T Y D H L I I R G F A A E G Q S Q N N Y L N G L K L Q G N F Y N D A V I D P Y M L E R A   :   1 6 2
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                        *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                  
F H U A _ E C O L I   :   E I M R G P V S V L Y G K S S P G G L L N M V S K R P T T E P L K E V Q F K A G T D S L F Q T G F D F S D S L D D D G V Y S Y R L T G L A R S A N A Q Q K G S E E   :   2 4 3
Q 8 X 9 0 1 _ E C O   :   E I M R G P V S V L Y G K S S P G G L L N M V S K R P T T E P L K E V Q F K A G T D S L F Q T G F D F S D A L D D D G V Y S Y R L T G L A R S A N A Q Q K G S E E   :   2 4 3
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                      *               2 6 0                   *               2 8 0                   *               3 0 0                   *               3 2 0                    
F H U A _ E C O L I   :   Q R Y A I A P A F T W R P D D K T N F T F L S Y F Q N E P E T G Y Y G W L P K E G T V E P L P N G K R L P T D F N E G A K N N T Y S R N E K M V G Y S F D H E F N   :   3 2 4
Q 8 X 9 0 1 _ E C O   :   Q R Y A I A P A F T W R P D D K T N F T F L S Y F Q N E P E T G Y Y G W L P K E G T V E P L P N G K R L P T D F N E G A K N N T Y S R N E K M V G Y S F D H E F N   :   3 2 4
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                    *               3 4 0                   *               3 6 0                   *               3 8 0                   *               4 0 0                      
F H U A _ E C O L I   :   D T F T V R Q N L R F A E N K T S Q N S V Y G Y G V C S D P A N A Y S K Q C A A L A P A D K G H Y L A R K Y V V D D E K L Q N F S V D T Q L Q S K F A T G D I D H   :   4 0 5
Q 8 X 9 0 1 _ E C O   :   D T F T V R Q N L R F A E N K T S Q N S V Y G Y G V C S D P A N A Y S K Q C A A L A P A D K G H Y L A R K Y V V D D E K L Q N F S V D T Q L Q S K F A T G D I D H   :   4 0 5
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                  *               4 2 0                   *               4 4 0                   *               4 6 0                   *               4 8 0                        
F H U A _ E C O L I   :   T L L T G V D F M R M R N D I N A W F G Y D D S V P L L N L Y N P V N T D F D F N A K D P A N S G P Y R I L N K Q K Q T G V Y V Q D Q A Q W D K V L V T L G G R Y   :   4 8 6
Q 8 X 9 0 1 _ E C O   :   T L L T G V D F M R M R N D I N A W F G Y D D S V P L L D L Y N P V N T D F D F N A K D P A N S G P Y R I L N K Q K Q T G V Y V Q D Q A Q W D K V L V T L G G R Y   :   4 8 6
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                                *               5 0 0                   *               5 2 0                   *               5 4 0                   *               5 6 0                          
F H U A _ E C O L I   :   D W A D Q E S L N R V A G T T D K R D D K Q F T W R G G V N Y L F D N G V T P Y F S Y S E S F E P S S Q V G K D G N I F A P S K G K Q Y E V G V K Y V P E D R P I   :   5 6 7
Q 8 X 9 0 1 _ E C O   :   D W A D Q E S L N R V A G T T D K R D D K Q F T W R G G V N Y L F D N G V T P Y F S Y S E S F E P S S Q V G K D G N I F A P S K G K Q Y E V G V K Y V P E D R P I   :   5 6 7
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                              *               5 8 0                   *               6 0 0                   *               6 2 0                   *               6 4 0                            
F H U A _ E C O L I   :   V V T G A V Y N L T K T N N L M A D P E G S F F S V E G G E I R A R G V E I E A K A A L S A S V N V V G S Y T Y T D A E Y T T D T T Y K G N T P A Q V P K H M A S   :   6 4 8
Q 8 X 9 0 1 _ E C O   :   V V T G A V Y N L T K T N N L M A D P E G S F F S V E G G E I R A R G V E I E A K A A L S A S V N V V G S Y T Y T D A E Y T T D T T Y K G N T P A Q V P K H M A S   :   6 4 8
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                            *               6 6 0                   *               6 8 0                   *               7 0 0                   *               7 2 0                              
F H U A _ E C O L I   :   L W A D Y T F F D G P L S G L T L G T G G R Y T G S S Y G D P A N S F K V G S Y T V V D A L V R Y D L A R V G M A G S N V A L H V N N L F D R E Y V A S C F N T Y   :   7 2 9
Q 8 X 9 0 1 _ E C O   :   L W A D Y T F F D G P L S G L T L G T G G R Y T G S S Y G D P A N S F K V G S Y T V V D A L V R Y D L A R V G M A G S N V A L H V N N L F D R E Y V A S C F N T Y   :   7 2 9
                                                                                                                                                                                                       
                                                                                                                                                                                                       
                          *               7 4 0                                                                                                                                                        
F H U A _ E C O L I   :   G C F W G A E R Q V V A T A T F R F   :   7 4 7                                                                                                                              
Q 8 X 9 0 1 _ E C O   :   G C F W G A E R Q V V A T A T F R F   :   7 4 7                                                                                                                              
                                                                                                                                                                                                       

Таблица несовпадений в белковых последовательностях

Номер позиции Аминокислота в FHUA_ECOLI Аминокислота в гомологе
37 P L
216 S A
434 N D

   Затем была построена аналогичная таблица для нуклеотидов и исследована зависимость нуклеотидных замен от белковых. При сопоставлении замен был использован стандартный генетический код.

Выравнивание нуклеотидных последовательностей

                                                                                                                                                                                                     
                                        *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                
B A B 9 6 7 2 6   :   a t g g c g c g t t c c a a a a c t g c t c a g c c a a a a c a c t c a c t g c g t a a a a t c g c a g t t g t a g t a g c c a c a g c g g t t a g c g g c a t g   :       8 1
A A G 5 4 4 5 4   :   a t g g c g c g t t c c a a a a c t g c t c a g c c a a a a c a c t c a c t g c g t a a a a t c g c a g t t g t a g t a g c c a c a g c g g t t a g c g g c a t g   :       8 1
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                  
B A B 9 6 7 2 6   :   t c t g t t t a t g c a c a g g c a g c g g t t g a a c c g a a a g a a g a c a c t a t c a c c g t t a c c g c t g c a c c t g c g c c g c a a g a a a g c g c a   :     1 6 2
A A G 5 4 4 5 4   :   t c t g t t t a t g c a c a g g c a g c g g t t g a a c t g a a a g a a g a c a c t a t c a c c g t t a c c g c t g c a c c t g c g c c g c a a g a a a g c g c a   :     1 6 2
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                    *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                    
B A B 9 6 7 2 6   :   t g g g g g c c t g c t g c a a c t a t t g c g g c g c g a c a g t c t g c t a c c g g c a c t a a a a c c g a t a c g c c g a t t c a a a a a g t g c c a c a g   :     2 4 3
A A G 5 4 4 5 4   :   t g g g g g c c t g c t g c a a c t a t t g c g g c g c g a c a g t c a g c t a c c g g c a c t a a a a c c g a t a c g c c g a t t c a a a a a g t g c c a c a g   :     2 4 3
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                  *               2 6 0                   *               2 8 0                   *               3 0 0                   *               3 2 0                      
B A B 9 6 7 2 6   :   t c t a t t t c t g t t g t g a c c g c c g a a g a g a t g g c g c t g c a t c a g c c g a a g t c g g t a a a a g a a g c g c t t a g c t a c a c g c c g g g t   :     3 2 4
A A G 5 4 4 5 4   :   t c t a t t t c t g t t g t g a c c g c c g a a g a g a t g g c g c t g c a t c a g c c g a a g t c g g t a a a a g a a g c g c t t a g c t a c a c g c c g g g t   :     3 2 4
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                *               3 4 0                   *               3 6 0                   *               3 8 0                   *               4 0 0                        
B A B 9 6 7 2 6   :   g t c t c t g t t g g t a c g c g t g g c g c a t c c a a c a c c t a t g a c c a c c t g a t c a t t c g c g g c t t t g c g g c a g a a g g c c a a a g c c a g   :     4 0 5
A A G 5 4 4 5 4   :   g t c t c t g t t g g t a c g c g t g g c g c a t c c a a c a c c t a t g a c c a c c t g a t c a t t c g c g g t t t t g c g g c a g a a g g c c a a a g c c a g   :     4 0 5
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                              *               4 2 0                   *               4 4 0                   *               4 6 0                   *               4 8 0                          
B A B 9 6 7 2 6   :   a a t a a c t a t c t g a a t g g c c t g a a g t t g c a g g g c a a c t t c t a t a a c g a t g c g g t c a t t g a c c c g t a t a t g c t g g a a c g c g c t   :     4 8 6
A A G 5 4 4 5 4   :   a a t a a c t a t c t g a a t g g c c t g a a g t t g c a g g g c a a c t t c t a t a a c g a t g c g g t c a t t g a t c c g t a t a t g c t g g a a c g c g c t   :     4 8 6
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                            *               5 0 0                   *               5 2 0                   *               5 4 0                   *               5 6 0                            
B A B 9 6 7 2 6   :   g a a a t t a t g c g t g g c c c g g t t t c c g t g c t t t a c g g t a a a a g c a g t c c t g g c g g c c t g t t g a a t a t g g t c a g c a a g c g t c c g   :     5 6 7
A A G 5 4 4 5 4   :   g a a a t t a t g c g t g g c c c g g t t t c c g t g c t t t a c g g t a a a a g c a g t c c t g g c g g c c t g t t g a a t a t g g t c a g c a a g c g t c c g   :     5 6 7
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                          *               5 8 0                   *               6 0 0                   *               6 2 0                   *               6 4 0                              
B A B 9 6 7 2 6   :   a c c a c c g a a c c g c t g a a a g a a g t t c a g t t t a a a g c c g g t a c t g a c a g c c t g t t c c a g a c t g g t t t t g a c t t t a g c g a t t c g   :     6 4 8
A A G 5 4 4 5 4   :   a c c a c c g a a c c g c t g a a a g a a g t t c a g t t t a a a g c c g g t a c t g a c a g c c t g t t c c a g a c t g g t t t t g a c t t t a g c g a t g c g   :     6 4 8
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                        *               6 6 0                   *               6 8 0                   *               7 0 0                   *               7 2 0                                
B A B 9 6 7 2 6   :   t t g g a t g a t g a c g g t g t t t a c t c t t a t c g c c t g a c c g g t c t t g c g c g t t c t g c c a a t g c c c a g c a g a a a g g g t c a g a a g a g   :     7 2 9
A A G 5 4 4 5 4   :   c t g g a t g a t g a c g g c g t t t a c t c t t a t c g c c t g a c c g g t c t t g c g c g t t c t g c c a a t g c c c a g c a g a a a g g g t c a g a a g a g   :     7 2 9
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                      *               7 4 0                   *               7 6 0                   *               7 8 0                   *               8 0 0                   *              
B A B 9 6 7 2 6   :   c a g c g t t a t g c t a t t g c a c c g g c g t t c a c c t g g c g t c c g g a t g a t a a a a c c a a t t t t a c c t t c c t t t c t t a c t t c c a g a a c   :     8 1 0
A A G 5 4 4 5 4   :   c a g c g t t a t g c t a t t g c a c c g g c g t t c a c c t g g c g t c c g g a t g a t a a a a c c a a t t t c a c c t t c c t t t c t t a c t t c c a g a a c   :     8 1 0
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                    8 2 0                   *               8 4 0                   *               8 6 0                   *               8 8 0                   *                
B A B 9 6 7 2 6   :   g a g c c g g a a a c c g g t t a t t a c g g c t g g t t g c c g a a a g a g g g a a c c g t t g a g c c g c t g c c g a a c g g t a a g c g t c t g c c g a c a   :     8 9 1
A A G 5 4 4 5 4   :   g a g c c g g a a a c c g g t t a t t a c g g c t g g t t g c c g a a a g a g g g a a c c g t t g a g c c g c t g c c g a a c g g t a a g c g t c t g c c g a c a   :     8 9 1
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                  9 0 0                   *               9 2 0                   *               9 4 0                   *               9 6 0                   *                  
B A B 9 6 7 2 6   :   g a c t t t a a t g a a g g g g c g a a g a a c a a c a c c t a t t c t c g t a a t g a g a a g a t g g t c g g c t a c a g c t t c g a t c a c g a a t t t a a c   :     9 7 2
A A G 5 4 4 5 4   :   g a c t t t a a c g a a g g g g c g a a g a a c a a c a c c t a t t c t c g t a a t g a g a a g a t g g t g g g c t a c a g c t t c g a t c a c g a a t t t a a c   :     9 7 2
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                9 8 0                   *             1 0 0 0                   *             1 0 2 0                   *             1 0 4 0                   *                    
B A B 9 6 7 2 6   :   g a c a c c t t t a c t g t g c g t c a g a a c c t g c g c t t t g c t g a a a a c a a a a c c t c g c a a a a c a g c g t t t a t g g t t a c g g c g t c t g c   :   1 0 5 3
A A G 5 4 4 5 4   :   g a c a c c t t t a c t g t g c g t c a g a a c c t g c g c t t t g c t g a a a a c a a a a c c t c g c a a a a c a g c g t t t a t g g t t a c g g c g t c t g c   :   1 0 5 3
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                            1 0 6 0                   *             1 0 8 0                   *             1 1 0 0                   *             1 1 2 0                   *                      
B A B 9 6 7 2 6   :   t c c g a t c c g g c g a a t g c t t a c a g c a a a c a g t g t g c g g c a t t a g c g c c a g c g g a t a a a g g c c a t t a t c t g g c a c g t a a a t a c   :   1 1 3 4
A A G 5 4 4 5 4   :   t c c g a t c c g g c g a a t g c t t a c a g c a a a c a g t g t g c g g c a t t a g c g c c a g c g g a t a a a g g c c a t t a t c t g g c a c g t a a a t a c   :   1 1 3 4
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                          1 1 4 0                   *             1 1 6 0                   *             1 1 8 0                   *             1 2 0 0                   *                        
B A B 9 6 7 2 6   :   g t c g t t g a t g a t g a g a a g c t g c a a a a c t t c t c c g t t g a t a c c c a g t t g c a g a g c a a g t t t g c c a c t g g c g a t a t c g a c c a c   :   1 2 1 5
A A G 5 4 4 5 4   :   g t c g t t g a t g a t g a g a a g c t g c a a a a c t t c t c c g t t g a t a c c c a g t t g c a g a g c a a g t t t g c c a c t g g c g a t a t c g a c c a c   :   1 2 1 5
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                        1 2 2 0                   *             1 2 4 0                   *             1 2 6 0                   *             1 2 8 0                   *                          
B A B 9 6 7 2 6   :   a c c c t g c t g a c c g g t g t c g a c t t t a t g c g t a t g c g t a a t g a c a t c a a c g c c t g g t t t g g t t a c g a c g a c t c t g t g c c a c t g   :   1 2 9 6
A A G 5 4 4 5 4   :   a c c c t g c t g a c c g g t g t c g a c t t t a t g c g t a t g c g t a a t g a c a t c a a c g c c t g g t t t g g t t a c g a c g a c t c c g t a c c g c t g   :   1 2 9 6
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                      1 3 0 0                   *             1 3 2 0                   *             1 3 4 0                   *             1 3 6 0                   *             1              
B A B 9 6 7 2 6   :   c t c a a t c t g t a c a a t c c g g t g a a t a c c g a t t t c g a c t t c a a t g c c a a a g a t c c g g c a a a c t c c g g c c c t t a c c g c a t t c t g   :   1 3 7 7
A A G 5 4 4 5 4   :   c t c g a t c t g t a c a a t c c g g t g a a t a c c g a t t t c g a c t t c a a t g c c a a a g a t c c g g c a a a c t c c g g c c c t t a c c g c a t t c t g   :   1 3 7 7
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                      3 8 0                   *             1 4 0 0                   *             1 4 2 0                   *             1 4 4 0                   *             1 4              
B A B 9 6 7 2 6   :   a a t a a a c a g a a a c a a a c g g g c g t t t a t g t t c a g g a t c a g g c g c a g t g g g a t a a a g t g c t g g t c a c c c t a g g c g g t c g t t a t   :   1 4 5 8
A A G 5 4 4 5 4   :   a a t a a g c a g a a a c a a a c g g g c g t t t a t g t t c a g g a t c a g g c g c a g t g g g a t a a a g t g c t g g t c a c c c t g g g c g g t c g t t a t   :   1 4 5 8
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                      6 0                   *             1 4 8 0                   *             1 5 0 0                   *             1 5 2 0                   *             1 5 4              
B A B 9 6 7 2 6   :   g a c t g g g c a g a t c a a g a a t c t c t t a a c c g c g t t g c c g g g a c g a c c g a t a a a c g t g a t g a c a a a c a g t t t a c c t g g c g t g g t   :   1 5 3 9
A A G 5 4 4 5 4   :   g a c t g g g c a g a t c a a g a a t c t c t t a a c c g c g t t g c c g g g a c g a c c g a t a a a c g t g a t g a c a a a c a g t t t a c c t g g c g t g g t   :   1 5 3 9
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                      0                   *             1 5 6 0                   *             1 5 8 0                   *             1 6 0 0                   *             1 6 2 0              
B A B 9 6 7 2 6   :   g g t g t t a a c t a c c t g t t t g a t a a t g g t g t a a c a c c t t a c t t c a g c t a t a g c g a a t c g t t t g a a c c t t c t t c g c a a g t t g g g   :   1 6 2 0
A A G 5 4 4 5 4   :   g g t g t t a a c t a c c t g t t t g a t a a t g g c g t a a c a c c t t a c t t t a g c t a t a g c g a a t c g t t t g a a c c t t c t t c g c a a g t t g g g   :   1 6 2 0
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                        *             1 6 4 0                   *             1 6 6 0                   *             1 6 8 0                   *             1 7 0 0                
B A B 9 6 7 2 6   :   a a g g a t g g t a a t a t t t t c g c a c c g t c t a a a g g t a a g c a g t a t g a a g t c g g c g t g a a a t a t g t a c c g g a a g a t c g t c c g a t t   :   1 7 0 1
A A G 5 4 4 5 4   :   a a g g a t g g t a a t a t t t t c g c a c c g t c t a a a g g t a a g c a g t a t g a a g t c g g c g t g a a a t a t g t a c c g g a a g a t c g t c c g a t t   :   1 7 0 1
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                      *             1 7 2 0                   *             1 7 4 0                   *             1 7 6 0                   *             1 7 8 0                  
B A B 9 6 7 2 6   :   g t a g t t a c t g g t g c c g t g t a t a a t c t c a c t a a a a c c a a c a a c c t g a t g g c g g a c c c t g a g g g t t c c t t c t t c t c g g t t g a a   :   1 7 8 2
A A G 5 4 4 5 4   :   g t a g t t a c t g g t g c c g t g t a t a a t c t c a c t a a a a c c a a c a a c c t g a t g g c g g a c c c t g a g g g t t c c t t c t t c t c g g t t g a a   :   1 7 8 2
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                    *             1 8 0 0                   *             1 8 2 0                   *             1 8 4 0                   *             1 8 6 0                    
B A B 9 6 7 2 6   :   g g t g g c g a g a t c c g c g c a c g t g g c g t a g a a a t c g a a g c g a a a c g g c c g c t g t c g g c g a g t g t t a a c g t a g t c g g t t c t t a t   :   1 8 6 3
A A G 5 4 4 5 4   :   g g t g g c g a g a t c c g c g c a c g t g g c g t a g a a a t c g a a g c g a a a g c g g c g c t g t c g g c g a g t g t t a a c g t a g t c g g t t c t t a t   :   1 8 6 3
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                  *             1 8 8 0                   *             1 9 0 0                   *             1 9 2 0                   *             1 9 4 0                      
B A B 9 6 7 2 6   :   a c t t a c a c c g a t g c g g a a t a c a c c a c c g a t a c t a c c t a t a a a g g c a a t a c g c c t g c a c a g g t g c c a a a a c a c a t g g c t t c g   :   1 9 4 4
A A G 5 4 4 5 4   :   a c t t a c a c c g a t g c g g a a t a c a c c a c c g a t a c t a c c t a t a a a g g c a a t a c g c c t g c a c a g g t g c c a a a a c a c a t g g c t t c g   :   1 9 4 4
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                                *             1 9 6 0                   *             1 9 8 0                   *             2 0 0 0                   *             2 0 2 0                        
B A B 9 6 7 2 6   :   t t g t g g g c t g a c t a c a c c t t c t t t g a c g g t c c g c t t t c a g g t c t g a c g c t g g g c a c c g g t g g t c g t t a t a c t g g c t c c a g t   :   2 0 2 5
A A G 5 4 4 5 4   :   c t g t g g g c t g a c t a t a c c t t c t t t g a c g g t c c g c t t t c a g g t c t g a c g c t g g g c a c c g g t g g t c g t t a t a c t g g c t c c a g c   :   2 0 2 5
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                              *             2 0 4 0                   *             2 0 6 0                   *             2 0 8 0                   *             2 1 0 0                          
B A B 9 6 7 2 6   :   t a t g g t g a t c c g g c t a a c t c c t t t a a a g t g g g a a g t t a t a c g g t c g t g g a t g c g t t a g t a c g t t a t g a t c t g g c g c g a g t c   :   2 1 0 6
A A G 5 4 4 5 4   :   t a t g g t g a t c c g g c t a a c t c c t t t a a a g t g g g a a g t t a t a c g g t c g t g g a t g c g t t a g t g c g t t a t g a t c t g g c g c g a g t c   :   2 1 0 6
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                            *             2 1 2 0                   *             2 1 4 0                   *             2 1 6 0                   *             2 1 8 0                            
B A B 9 6 7 2 6   :   g g c a t g g c t g g c t c c a a c g t g g c g c t g c a t g t t a a c a a c c t g t t c g a t c g t g a a t a c g t c g c c a g c t g c t t t a a c a c t t a t   :   2 1 8 7
A A G 5 4 4 5 4   :   g g c a t g g c g g g c t c c a a c g t g g c g c t g c a t g t t a a c a a c c t g t t c g a t c g t g a a t a c g t c g c c a g c t g c t t t a a c a c t t a t   :   2 1 8 7
                                                                                                                                                                                                     
                                                                                                                                                                                                     
                          *             2 2 0 0                   *             2 2 2 0                   *             2 2 4 0                                                                      
B A B 9 6 7 2 6   :   g g c t g c t t c t g g g g c g c a g a a c g t c a g g t c g t t g c a a c c g c a a c c t t c c g t t t c t a a   :   2 2 4 4                                                
A A G 5 4 4 5 4   :   g g c t g c t t c t g g g g c g c a g a a c g t c a g g t c g t t g c a a c c g c a a c c t t c c g t t t c t a a   :   2 2 4 4                                                
                                                                                                                                                                                                     

Таблица несовпадений в нуклеотидных последовательностях

Номер позиции Нуклеотид в FHUA_ECOLI Нуклеотид в гомологе Комментарий
110 c t Сответствует замене в 37 позиции в белковом выравнивании
198 t a Синонимичная замена в третьей позиции кодона
381 c t Синонимичная замена в третьей позиции кодона
465 c t Синонимичная замена в третьей позиции кодона
646 t g Сответствует замене в 216 позиции в белковом выравнивании
649 t c Синонимичная замена в первой позиции кодона (Leu – Leu)
663 t c Синонимичная замена в третьей позиции кодона
786 t c Синонимичная замена в третьей позиции кодона
900 t c Синонимичная замена в третьей позиции кодона
945 c g Синонимичная замена в третьей позиции кодона
1287 t c Синонимичная замена в третьей позиции кодона
1290 g a Синонимичная замена в третьей позиции кодона
1293 a g Синонимичная замена в третьей позиции кодона
1300 a g Сответствует замене в 434 позиции в белковом выравнивании
1383 a g Синонимичная замена в третьей позиции кодона
1446 a g Синонимичная замена в третьей позиции кодона
1566 t c Синонимичная замена в третьей позиции кодона
1581 c t Синонимичная замена в третьей позиции кодона
1825 c g Эти мутации описаны в Swiss-Prot как разногласия между различными источниками гена FHUA_ECOLI
1826 g c
1828 c g
1945 t c Синонимичная замена в первой позиции кодона (Leu – Leu)
1959 c t Синонимичная замена в третьей позиции кодона
2025 t c Синонимичная замена в третьей позиции кодона
2085 a g Синонимичная замена в третьей позиции кодона
2115 t g Синонимичная замена в третьей позиции кодона

   Как видно, число замен нуклеотидов между близкими гомологами заметно превышает число аминокислотных замен. Причина — большая доля синонимичных замен среди общего их числа. Отношение количества синонимичных замен к несинонимичным равно 20:3 (замены, описанные в Swiss-Prot как несовпадения генов, не учитывались). Это говорит о том, что сохранение в неприкосновенности аминокислотной последовательности было очень важным фактором для стабилизирующего естественного отбора.

Матрица нуклеотидных замен

Нуклеотиды a t g c
a 1 6 0
t 1 2 13
g 6 2 4
c 0 13 4

   Основной вывод, который можно сделать, опираясь на данные этой матрицы заключается в том, что транзиции (замены пиримидинового нуклеотида на пиримидиновый, а пуринового — на пуриновый) встречаются чаще трансверсий (остальных замен).

Исследование зависимости процента совпадений последовательностей белков от процента совпадений последовательностей их генов

   Программой needle были построены попарные глобальные выравнивания белков и соответствующих им генам. Параметры для программы были взяты по умолчанию. По этим данным был построен график зависимости попарных совпадений аминокислот белков от попарных совпадений нуклеотидов генов (на рисунке слева). Этот график был сравнён с аналогичным графиком, созданным по данным белков гемагглютина гриппа (на рисунке справа).

   Данные по белку FHUA_ECOLI и его гомологам хорошо кореллируют с данными по предшественнику гемагглютинина, а именно график находится под линией, соединяющей точки (5;25) и (100;100). То есть процент совпадений генов ниже среднего ожидаемого. Это, по-видимому, обусловлено заменами преимущественно в третьих положениях кодонов. Однако небольшое различие между графиками всё-таки есть: при проценте совпадений в генах большем 80, график для гомологов белка FHUA_ECOLI лежит немного ниже относительно графика для вирусного белка, то есть при одинаковом проценте различий в генах, процент различий в белках у вируса больше. Это связано с тем, что вирусы обычно подвергаются давлению движущего отбора, в то время как родственные бактерии (на близкое указывает сходство их генов) обитают, скорее всего, в схожей среде, поэтому им не свойственно большое количество аминокислотных замен.

На главную страницу третьего семестра


© Лохматиков Алексей,2005