Fillogenetic trees Design by Rhymester Dan
mailto:KovrovDV@rambler.ru
kodomo.fbb.msu.ru
Terms
Other results
Home page
 
В данном задании предложена такая скобочная модель филогенетического дерева.

(((((А:10,B:10):50,C:65):5,D:70):5,E:70):30,F:100);

По ней вручную было нарисовано дерево - изображение ниже.
                       +--A
                 50    |10
            +----------+
           5|          |10
          +-+          +--B
          | |      65
         5| +-------------C
        +-+
        | |      70
    30  | +--------------D
 +------+ 
 |      |     70   
 |      +--------------E
-+
 |        100
 +--------------------F

Также по этой скобочной формуле можно построить разбиение по веткам, считая дерево неукорененным. Ниже можно увидеть структуру дерева (без корня) с подписанными внутренними ветвями, а слева таблица самого разбиения.
                       +--A
                 (1)   |
            +----------+
         (2)|          |
          +-+          +--B
          | |      
       (3)| +-------------C
        +-+
        | |      
    (4) | +--------------D
 +------+ 
 |      |     
 |      +--------------E
 |
 |        
 +--------------------F
    A B C D E F

(1) . . * * * *
(2) . . . * * *
(3) . . . . * *
Длина гена моего белка 870 нуклеотидов, Поэтому для создания мутантных последовательностей был посчитан коэффициент, преобразующий эволюционное растояние в количество реальных замен. Т.к. в эволюционном расстоянии считает кол-во замен на 100 нуклеотидов, то в мутантах - по 8,7 замен на единицу эволюционного расстояния. И округляем до целых
На изображении ниже подписаны все листья и узла дерева. Их последовательности были созданы с помощью случайных мутаций, вводимых в последовательность соответствующего "предкового узла" для каждой поcледовательности пропорционально эволюционному расстоянию. Технически это было сделано с помощью скрипта.
Названия полученных файлов совпадают с надписями и лежат в папке Term4/Practice1/Mut.
                       +--A
                 50    |10
            +----------+ AB
           5|          |10
          +-+ABC       +--B
          | |      65
         5| +-------------C
        +-+ ABCD
        | |      70
    30  | +--------------D
 +------+ ABCDE
 |      |     70   
 |      +--------------E
 +SUCD_ECOLI
 |        100
 +--------------------F
Следующие изображения иллюстрируют выдачи различных программ(все файлы выдачи располагаются в директории Term4/Practice1/Mut):
"fdnaml" - алгоритм максимального правдоподобия изображение получено с помощью команды fdnaml alin2.fasta -ttratio 1 -auto

  +-B         
  |  
  |                  +--------------------------------F         
  |             +----4  
  |          +--3    +-------------E         
  |          |  |  
  1----------2  +--------------D         
  |          |  
  |          +-------------C         
  |  
  +--A         


    A B C D E F   |
(2) . . * * * *   |
(3) . . . * * *   |
(5) . . . . * *   |      

топология дерева
идентична первоначальному
(построенному вручную)

Для двух следующих деревьев в начале были подсчитаны попарные расстония командой:
fdnadist alin2.fasta -ttratio 1 -auto
А затем применялись сами алгоритмы построения деревьев:
"Neighbor-joining" командой fneighbor alin2.fdnadist -auto
  +-B         
  ! 
  !          +--------------C         
  1----------3 
  !          ! +---------------D         
  !          +-4 
  !            !     +-------------E         
  !            +-----2 
  !                  +----------------------------------F         
  ! 
  +--A       
    A B C D E F   |
(1) . . * * * *   |
(3) . . . * * *   |
(5) . . . . * *   |   

топология дерева
идентична первоначальному
(построенному вручную)

"UPGMA" командой fneighbor ali.fdnadist -treetype u -auto


                                                   +---A         
                           +-----------------------1 
                         +-2                       +---B         
                         ! ! 
                     +---3 +---------------------------C         
                     !   ! 
  +------------------4   +-----------------------------D         
  !                  ! 
--5                  +---------------------------------E         
  ! 
  +----------------------------------------------------F           

    A B C D E F   |
(1) . . * * * *   |
(3) . . . * * *   |
(5) . . . . * *   |

топология дерева
идентична первоначальному
(построенному вручную)

В результате видно, что если рассматривать топологию деревьев 6 основных последовательностей, то все алгоритмы выдают одно и тоже. Вероятно, это связанно с тем, что в рассматриваемой модели всего 6 белков. Распределение количества мутаций довольно сильно обособляет А,В от всех остальных, С от AB и так далее, т.е. расстояние между ветвями, например, второго узла (см. изображение алгоритма UPGMA )гораздо больше, чем расстояние от A до B. Распределение мутаций действительно случайно, что, в реальной жизни, выполняется далеко не всегда, достаточно вспомнить Ka,Ks.Kроме того, алгоритм UPGMA дополнительно создает дерево укорененное и внешне идентичное первоначальному. Но стоит отметить, что первоначально дерево не ультраметрично, а результатом алгоритма UPGMA может быть только ультраметричное дерево, какое мы и видим в результате.



LikBez aka Rhymester Dan 06.03.08