Четвертый семестр

Филогенетические деревья. Часть 2

  1. Таксономический сервис NCBI
  2. При помощи таксономического сервиса NCBI были установлены таксоны, к котроым принадлежат выбранные мной в предыдущем задании бактерии:
    Мнемоника ТАксономическое положение
    CLOTE Clostridia; Clostridiales; Clostridiaceae; Clostridium
    FINM2 Clostridia; Clostridiales; Clostridiales incertae sedis; Clostridiales Family XI. Incertae Sedis; Finegoldia
    THETN Clostridia; Thermoanaerobacterales; Thermoanaerobacteraceae; Caldanaerobacter; Caldanaerobacter subterraneus
    PEDPA Bacilli; Lactobacillales; Lactobacillaceae; Pediococcus
    LACDA Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus
    STAES Bacilli; Bacillales; Staphylococcaceae; Staphylococcus
    STAA1 Bacilli; Bacillales; Staphylococcaceae; Staphylococcus
    BACAN Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group

    Ветвь (CLOTE;FINM2) выделяет отряд Clostridiales;
    (CLOTE;FINM2;THETN) - класс Clostridia;
    (PEDPA;LACDA)- семейство Lactobacillaceae;
    (STAES;STAA1)- род Staphylococcus;
    (STAES;STAA1;BACAN)- порядок Bacillales;
    (STAES;STAA1;BACAN;PEDPA;LACDA)- класс Bacilli;
  3. Был выбран класс белков PROZ, при помощи команды seqret и соответствующего list-файла были получены последовательности интересующих меня белков.
  4. MUSCLE
  5. При помощи программы muscle было построено выравнивание полученных белков.
    С ним можно озакомиться, перейдя по данной ссылке: MUSCLE
  6. Реконструкцию дерева программой fprotpars
  7. С использованием данной программы было найдено одно дерево: ((((STAES,STAA1),(THETN,PEDPA)),((LACDA,CLOTE),FINM2)),BACAN);
  8. FPROTDIST
  9. При помощи программы FPROTDIST была получена матрица весов:
                BACAN      CLOTE	  FINM2	     LACDA	PEDPA      STAA1	STAES	     THETN 
    BACAN       0.000000   6.860263   1.985559   13.968043  8.282032   2.626408   2.267405   4.254765
    CLOTE       6.860263   0.000000   35.434774  9.265663   12.297717  34.333316  32.682516  9.461800
    FINM2       1.985559   35.434774  0.000000   10.909903  38.286710  2.983641   2.347935   6.525381
    LACDA       13.968043  9.265663   10.909903  0.000000   17.964582  34.084898  35.337695  15.610990
    PEDPA       8.282032   12.297717  38.286710  17.964582  0.000000   2.632435   2.356204   1.515593
    STAA1       2.626408   34.333316  2.983641   34.084898  2.632435   0.000000   0.305648   35.786734
    STAES       2.267405   32.682516  2.347935   35.337695  2.356204   0.305648   0.000000   30.582345
    THETN       4.254765   9.461800   6.525381   15.610990  1.515593   35.786734  30.582345  0.000000
    

    Условие ультраметричности: d(A,B) > d (B,C), то d (A,C) = d (A,B); проверим его для данной матрицы: 1)d(STAES,STAA1)=0.305648
    d(STAES,PEDPA)=2.356204
    d(STAA1,PEDPA)=2.632435
    отклонение составляет:2.632435-2.356204=0,276231 2)d(STAES,FINM2)=2.347935
    d(STAES,BACAN)=2.267405
    d(BACAN,FINM2)=1.985559
    отклонение составляет:2.347935-2.267405=0,08053 3)d(BACAN,LACDA)=13.968043
    d(BACAN,CLOTE)=6.860263
    d(CLOTE,LACDA)=9.265663 отклонение составляет:13.968043-9.265663=4,70238
    из этих данный можно сделать вывод:чем последовательности ближе, тем с наименьшим отклонением выполняется ультраметричность.
    Условие аддитивности выполняется в том случае, если существуют четыре точки A,B,C,D, такие что AB+CD=AC+BD>AD+BC. Проверим выполняется ли данное условие:
    d(STAES,STAA1)+d(TETHN,PEDPA)=0.305648+1.515593=1,821241
    d(STAES,TETHN)+d(STAA1,PEDPA)=30.582345+2.632435=33,21478
    d(STAES,PEDPA)+d(TETHN,STAA1)=2.356204+35.786734=38,142938
    условие аддитивности не выполняется. Отклонение от аддитивности равно 4,928158
  10. Программа fneighbor
    • Алгоритм Neighbor-Joining
    • Neighbor-Joining/UPGMA method version 3.69
      
      
         8 Populations
      
       Neighbor-joining method
      
       Negative branch lengths allowed
      
      
                                                     +------------CLOTE     
                                       +-------------1 
                                +------2             +----------LACDA     
                                !      ! 
        +-----------------------3      +-----THETN     
        !                       ! 
        !                       +PEDPA     
        ! 
        !                  +-------FINM2     
        !                +-5 
        4----------------6 +STAA1     
        !                ! 
        !                +STAES     
        ! 
        +BACAN     
      
      
      remember: this is an unrooted tree!
      
      Between        And            Length
      -------        ---            ------
         4             3            9.04740
         3             2            2.63350
         2             1            5.46257
         1          CLOTE           4.89902
         1          LACDA           4.36664
         2          THETN           2.44099
         3          PEDPA          -0.57832
         4             6            6.58025
         6             5            0.52254
         5          FINM2           2.89136
         5          STAA1           0.09228
         6          STAES          -0.68757
         4          BACAN          -5.40084
      
    • Алгоритм UPGMA
    • 
      Neighbor-Joining/UPGMA method version 3.69
      
      
         8 Populations
      
       UPGMA method
      
       Negative branch lengths allowed
      
      
                                                            +----BACAN     
                                                          +-3 
                                                          ! +----FINM2     
        +-------------------------------------------------4 
        !                                                 !     +STAA1     
        !                                                 +-----1 
        !                                                       +STAES     
      --7 
        !                              +------------------------CLOTE     
        !                  +-----------5 
        !                  !           +------------------------LACDA     
        +------------------6 
                           !                                 +---PEDPA     
                           +---------------------------------2 
                                                             +---THETN     
      
      
      From     To            Length          Height
      ----     --            ------          ------
         7        4          9.10676         9.10676
         4        3          0.28539         9.39216
         3     BACAN         0.99278        10.38494
         3     FINM2         0.99278        10.38494
         4        1          1.12535        10.23211
         1     STAA1         0.15282        10.38494
         1     STAES         0.15282        10.38494
         7        6          3.46805         3.46805
         6        5          2.28405         5.75211
         5     CLOTE         4.63283        10.38494
         5     LACDA         4.63283        10.38494
         6        2          6.15909         9.62714
         2     PEDPA         0.75780        10.38494
         2     THETN         0.75780        10.38494
      

©Анисенко Андрей