На страницу II-ого семестра

Филогенетические деревья, реконструированные разными способами

Эталонное множественное выравнивание домена Eps3 последовательностей MOAA_BACSU, BIOB_YEAST, HEMN_BRAJA, YQEV_BACSU, HEMN_AQUAE. Данное выравнивание можно также посмотреть в файле Eps3.msf

                                                                                                                                                                                           
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                      
M O A A _ B A C S U   :   R D L R I S V T D R C N F R C T Y C M P A E L F G P D Y P F L K K - - - E E L L S F E E L E R L A T L F - - - V T R F G - - V E K I R L T G G E P L M   :     6 7
B I O B _ Y E A S T   :   C T L M N I K S G G C S E D C K Y C A Q S S R N D T G - - - - - - L K A E K M V K V D E V I K E A E E A - - - - K R N G - - S T R F C L G A A W R D M   :     6 3
H E M N _ B R A J A   :   S A S L Y L H V P F C R E M C W Y C G C H T Q I V R R - - - - - - - D D L I A A Y Q R T L R S E I A L V A E T I G R R I - K V E H I H F G G G T P T I   :     6 7
Y Q E V _ B A C S U   :   T R A S L K I Q E G C N N F C T F C I I P W A R G - - - - - - - - - - L L R S R D P E E V I K Q A Q Q L V D A G Y K E I - V L T G I H T G G Y G E D M   :     6 4
H E M N _ A Q U A E   :   P L S L Y F H I P F C E Q R C L Y C G C N V I I S H R - - - - - - - K G I E E P Y L E R V C R E M D L V - S Q Y L D K D R K V I Q L H W G G G T P N Y   :     6 7
                                              C       C     C                                                                                                                              
                                                                                                                                                                                           
                                8 0                   *               1 0 0                   *               1 2 0                   *               1 4 0                   *            
M O A A _ B A C S U   :   R K - - D M P E L I K K L A R I P G I - - R D I A M T T N - - - G S L L P V Y A K R L K E A G L K - - R V T I S L D S L E D E R F K K I N G R G V S V   :   1 3 3
B I O B _ Y E A S T   :   K G R K S A M K R I Q E M V T - - - - K V N D M G L E T C V T L G M V D Q D Q A K Q L K D A G L T - - A Y N H N I D T S R E H Y S K - - V I T T R T Y   :   1 3 0
H E M N _ B R A J A   :   M A P E A F A E L M A A M R Q A F F V - L P S A E I A V E I D P R T L T A D M V E A M R L S G V N - - R A S L G V Q S F D P I V Q R A - I N R I Q S F   :   1 3 8
Y Q E V _ B A C S U   :   K D Y N - F A K L L S E L D T R V E G - - V K R I R I S S I E A S Q I T D E V I E V L D R S D K I V N H L H I P I Q S G S N T V L K R - M R R K Y T M   :   1 3 5
H E M N _ A Q U A E   :   L S P E Q I K W F M E E I R K R F E - F G D N A E I S I E L D P R Y L T D E Q I K A I K D A G F N - - R I S L G V Q D L D P K V Q Q A - V N R V Q P Y   :   1 3 8
                                                                                                                                                                                           
                                                                                                                                                                                           
                                        1 6 0                   *               1 8 0                   *               2 0 0                   *               2 2 0                      
M O A A _ B A C S U   :   S K V L E G I E A A K Q A G - - L G V K I N M V V - Q K G V N E K D I L P M A R - - - Y F K E K G H I L R F I E F M D V G N T - - - N Q W E K - - K D   :   1 9 7
B I O B _ Y E A S T   :   D D R L Q T I K N V Q E S G - - I K A C T G G I L G L G - E S E D D H I G F I Y T L S N M S P H P E S L P I N R L V A I K G T P M A E E L A D P K S K   :   2 0 2
H E M N _ B R A J A   :   E Q T A A V V D M L R H A G - I A G I N F D L I Y G L P H Q T V A S C L D T V R R - - S L L L A P D R F S V F G Y A H V P D F K K H Q R M I N Q - G A   :   2 0 9
Y Q E V _ B A C S U   :   E F F A D R L N K L K K A L P G L A V T S D V I V G F P G E T E E E F M E T Y N F - - I K E H K F S E L H V F P Y S K R T G T P A A R M E D Q - - V D   :   2 0 6
H E M N _ A Q U A E   :   E L I K E K M E K L R E A G - F E S I N L D L I Y G L P Y Q T K E S F E K T V E K - - V I E L N P D R I A T Y S F A Y I P Q V K P H Q Q L L P - K E A   :   2 0 9
                                                                                                                                                                                           
                                                               
                                  *                            
M O A A _ B A C S U   :   V M T K A E I I D L I N K   :   2 1 0
B I O B _ Y E A S T   :   K L Q F D E I L R T I A T   :   2 1 5
H E M N _ B R A J A   :   L P D G P A R H D Q A C A   :   2 2 2
Y Q E V _ B A C S U   :   E N V K N E R V H R L I A   :   2 1 9
H E M N _ A Q U A E   :   L P S A E E K L R I F E M   :   2 2 2
                                                               
  1. Построение дерева по алгоритму UPGMA (кластерный метод)

         Все ниже описанное можно посмотреть в файле UPGMA.xls
         Для построения дерева для эталонного выравнивания была получена попарных совпадений последовательностей в этом выравнивании. На основании этой матрицы была построена матрица "наивных" эволюционных расстояний. Полученная матрица была использована для построения ультраметрического филогенетического дерева по методу UPGMA (Unweighted Pair Group Method with Arithmetic Mean). В результате выполнения алгоритма, предусмотренного этим методом получили правильную скобочную структуру дерева:

    (((HEMN_BRAJA:0.305, HEMN_AQUAE:0.305):0.1235, YQEV_BACSU:0.4275):0.013125, (MOAA_BACSU:0.425, BIOB_YEAST:0.425):0.015625);

  2. Визуализация построенного дерева

    Скобочная структура, полученная выше, была визуализована с помощью программ из Online-версии пакета Phylip: drawtree и drawgram. Все параметры были приняты по умолчанию.

    Визуальзация дерева алг. UPGMA
    Левое дерево неукорененное, получено с помощью программы drawtree. Правое дерево укорененное, получено программой drawgram. На обоих деревьях отражены родственные связи между белками 4 из которых находятся в бактериях и только 1 белок из эукариотического организма (пекарские дрожжи (YEAST)). На мой взгляд укорененное дерево хорошо отражает ситуацию. Так исходя из этого дерева можно предположить следующий сценарий эволюции. От некоторой гипотетической предковой последовательности образовалось две ветви, на которых были еще по одной предковой последовательности, от первой из которых образовались BIOB_YEAST и MOAA_BACSU; а от второй произошли еще одна гипотетическая последовательности и EQEV_BACSU. От последней гипотетической последовательности произошли HEMN_BRAJA и HEMN_AQUAE.

  3. Построение дерева методом ближайших соседей (Neighbor-joining)

    Эталонное выравнивания домена Eps3 перевели в fasta формат, а затем с помощью программы emma (програмный пакет EMBOSS) построили множественное выравнивания. Из файла руководящего дерева взяли правильную скобочную структуру:

    ((MOAA_BACSU:0.40986,BIOB_YEAST:0.42824):0.02273,(HEMN_BRAJA:0.31194,HEMN_AQUAE:0.29166):0.13981,YQEV_BACSU:0.41227);

    Эта скобочная структура была визуализована теми же программами, что и в предыдущем пункте.

    Визуализация дерева алг. Neighbor-joining

    Неукорененное дерево - слева, укорененное - справа.
    Итак сравнивания изображения, полученные с помощью разных алгоритмов следует заметить, что неукоренненые деревья получились одинаковыми. Укоренненые деревья несколько отличаются. Тем не менее они отражают почти одинаковый сценарий эволюции.


© Sedliarov Vitaliy