Филогенетические деревья, реконструированные разными способами

На главную страницу второго семестра

 

Филогенетические деревья построены на основании выравнивания последовательностей 5 доменов из семейства CaiB/BaiF. Эти домены обладают формил-КоА-трансферазной активностью. Чтобы оценить правдоподобность дерева, надо знать, о каких белках идет речь.

Здесь представлено множественное выравнивание последовательностей исследованных доменов.

                                                                                                                                                                                                           
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
Y S 7 4 _ C A E E L   :   K Q L D L K N P E D I K K V R D L C Q T S D V L L D P Y R P G T L E K M G L D P - S T L W N N N K G L I I C K I S G Y G Q T G - - - - - R M S Q E T G H D I N Y V A L   :     7 7
Y F D E _ E C O L I   :   V V L D L K N D H D K S I F I N M L K Q A D V L A E N F R P G T M E K L G F S W - E T L Q E I N P R L I Y A S S S G F G H T G - - - - - P L K D A P A Y D T I I Q A M   :     7 7
O 2 9 2 8 8 _ A R C   :   V T L N I E K E E G R E L L K R L V K K A D V L I E S F K P G Y M D S L G I G Y - R H L K E I N P G L I Y C A V N T Y G Q F G E D A K - K H S N Q P D Y D M T D Q A R   :     8 1
F C T A _ S H I F L   :   I E L N T K T A E G K E V M E K L I R E A D I L V E N F H P G A I D H M G F T W - E H I Q E I N P R L I F G S I K G F D E C S - - - - - P Y V N V K A Y E N V A Q A A   :     7 7
O 3 0 2 1 5 _ A R C   :   V A L D I K S E E G R K I F Y E L L K H A D I F I E N L V - W L E E R Y G I T D - K D M L E A N P R L V I V H V S G F G R S E F G G E D E K C G R G S Y D I I S Q A Y   :     8 1
                              L 1   k     e               6       a D 6 l   e       p g           G             6   e   N p   L 6           g 5 g                               y d       q A              
                                                                                                                                                                                                           
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                        
Y S 7 4 _ C A E E L   :   S G M L P T F S G V N A T - - - - - - - - R P W P P A N M L A D F A G G G L S A A F G I L S A I Y A R S H N G G K G C L L D C S M T E G V A - Y L S S F V Q H Y Y D Q   :   1 5 1
Y F D E _ E C O L I   :   S G I M M E T G Y P D A - - - - - - - - - P P V R V G T S L A D L C G G - V Y L F S G I V S A L Y G R E K S Q - R G A H V D I A M F D A T L S F L E H G L M A Y I A T   :   1 4 9
O 2 9 2 8 8 _ A R C   :   G V V M S V T G E P E L D P E V P Q E Y K K P L K H G N W M G W Y V G G - T W A A F G I L L A M F Y K R K T G - K G Q M I D A A P P E G M M A I S N Y L M Q Y F H L T   :   1 6 2
F C T A _ S H I F L   :   G G A A S T T G F W D G - - - - - - - - - P P L V S A A A L G D S N T G - M H L L I G L L A A L L H R E K T G - R G Q R V T M S M Q D A V L N L C R V K L R D Q Q R L   :   1 4 9
O 3 0 2 1 5 _ A R C   :   S G W C K L A A P P G M - - - - - - - - - E V H R L P L Y I G D Y V T A - L F G V I G A L S A Y V Y A K E T G - R G Q V V D V A Q F E A I A R V I E M Y Y T M Y H N L   :   1 5 3
                            g                                         p             6   d       g             G   6   A               g   4 G     6 d                                                      
                                                                                                                                                                                         
                                *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0            
Y S 7 4 _ C A E E L   :   P - - - - - N L F T D - - - - - - - - - - - - - - - - - - - - - - K - - Y A L F S G E C P I Y R T Y K T - - - K D D K F V A V G A V E P K F Y Q N L   :   1 9 3
Y F D E _ E C O L I   :   G - - - - - - K S P Q - - - - - - - - - - - - - - - - - - - - - - - R L G N R H P Y M A P F D V F N T Q - - - - D K P I T I C C G N D - K L F S A L   :   1 8 9
O 2 9 2 8 8 _ A R C   :   K N - - - - - K M V R - - - - - - - - - - - - - - - - - - - - - - - - A G N F D Y A V F P Y T Y V R C K - - - - D G Y A F M S G F T D - P N W A A L   :   2 0 2
F C T A _ S H I F L   :   D K L G Y L E E Y P Q - Y P N G T F - - - G - - - - - D - - - A V P R G G N A G G G G Q P G W I L K C K G W E T D P N A Y I Y F T I Q E Q N W E N T   :   2 1 1
O 3 0 2 1 5 _ A R C   :   G - - - - - - I N R E - - - - - - - - - - - - - - - - - - - - - - - G E G L R V F N T Q P Y G L Y R V K - - - - D G W I A I G A I G P G L Y Q R F I   :   1 9 4
                                                                                                  g               P                       D                                              
 

Здесь можно ознакомиться с построеннной на основании этого выравнивания матрицей попарных совпадений, а также с проведенными на ее основе расчетами по алгоритму UPGMA. Этот алгоритм позволяет достаточно просто построить филогенетическое дерево, используя группировку последовательностей с наименьшим эволюционным расстоянием. На основании вычислений построена скобочная структура дерева (см. лист UPGMA), визуализированная с помощью программ drawtree и drawgram. Вот результат.

Дерево, построенное программой drawtree Дерево, построенное программой drawgram

Как видим, программа drawgram строит укорененное дерево, в отличие от drawtree. Но построенные деревья различаются не только этим. В первом случае в один кластер объединены последовательности O30215_ARCFU и YS74_CAEEL, а последовательность O29288_ARCFU сочтена недостаточно к ним близкой. Во втором случае последовательности O29288_ARCFU и O30215_ARCFU все-таки попадают в один кластер, а YS74_CAEEL туда не попадаeт. На мой субъективный взгляд, такое дерево более сходно с реальным эволюционным процессом (так как археи и нематоды эволюционно далеки (разные царства), их белки должны различаться сильнее паралогичных белков одной отдельно взятой архебактерии). C другой стороны, есть и общие черты - в обоих случаях близко расположены последовательности FCTA_SHIFL и YFDE_ECOLI, что неудивительно, учитывая эволюционную близость кишечной палочки и шигеллы Флекснера: они относятся к одному и тому же семейству Enterobacteriaceae.

На основании второго дерева можно восстановить следующий сценарий эволюции. От гипотетической предковой последовательности A произошла последовательность YS74_CAEEL и некоторая последовательность B, от которой произошла последовательность O30215_ARCFU и некоторая последовательность С. От последней произоши последовательности O29288_ARCFU и некоторая последовательность D, от которой, в свою очередь, произошли FCTA_SHIFL и YS74_ECOLI.

 

Дерево, построенное по методу ближайших соседей.

 
Дерево, построенное программой drawtree Дерево, построенное программой drawgram

Сразу же хочется отметить, что эти деревья сложнее читаются из-за трудноразличимых общих ветвей. Однако разобравшись, можно отметить, что они напоминают аналогичные деревья, построенные методом UPGMA. Те же последовательности сближены или разобщены на обоих деревьях программы drawtree и на обоих деревьях программы drawgram. Сценарий эволюции тоже вырисовывается одинаковый, что не может не радовать.


©Петрова Ирина