На главную страницу
На главную страницу четвертого семестра

Филогенетическое дерево и его реконструкция

    Моделирование эволюции гена

  1. Модель эволюции гена aroE_Ecoli в виде скобочной структуры и графическом виде:

    (А:110,((В:65,(С:40,D:40):25):35,(Е:45,F:45):50):10);
     

    под веткой a имеется ввиду ветка между A и кластером BCDEF, а не расстояние между A и корнем

  2. То же дерево в виде таблицы листов (ветви, отделяющие один лист, опущены):

      A B C D E F
    b . * * * . .
    c . . . . * *
    e . . * * . .
     

  3. Ген aroE_Ecoli имеет длину 819 нуклеотидов, поэтому общее число мутаций за переход x равно
              Nx = nx * 8,19,     где nx – длина ветви x.

    Получим последовательности всех листьев и промежуточных узлов (программа msbar, скрипт):

    msbar aroE_Ecoli.fasta     A.fasta   -point  4 -count 901 -auto
    msbar aroE_Ecoli.fasta BCDEF.fasta   -point  4 -count 82 -auto
    msbar    BCDEF.fasta   BCD.fasta   -point 4 -count 287 -auto
    msbar      BCD.fasta     B.fasta   -point 4 -count 532 -auto
    msbar      BCD.fasta    CD.fasta   -point 4 -count 205 -auto
    msbar       CD.fasta     C.fasta   -point 4 -count 328 -auto
    msbar       CD.fasta     D.fasta   -point 4 -count 328 -auto
    msbar    BCDEF.fasta    EF.fasta   -point 4 -count 410 -auto
    msbar       EF.fasta     E.fasta   -point 4 -count 369 -auto
    msbar       EF.fasta     F.fasta   -point 4 -count 369 -auto
    Все последовательности листьев объединены в файле list.fasta.

  4. Далее исследуем различные методы реконструкции филогенетического дерева.

    ветка максимального правдоподобия Neighbor-joining UPGMA Реальное дерево
    b .***.. + + + +
    c ....** + + + +
    e ..**.. + + + +

    Топология всех трех деревьев совпадают с истинным. Деревья, построенные алгоритмами максимального правдоподобия и Neighbor-joining идентичны, незначительно отличаются только длины некоторых ветвей.
    UPGMA-дерево, в отличие от двух предыдущих, укорененное. Оно также ультраметрично, то есть длины всех "полных" ветвей равны (расстояния от корня до листьев одинаковы). Однако это неверно – исходное дерево не является ультраметричным.

    Итак, все использованные алгоритмы правильно восстановили ход эволюции (топологию, но не корень).

    Bootstrap и drawtree

  5. Проведем "бутстреп"-анализ листьев исследуемого дерева.
    Для этого используем программы fseqboot (построение 100 "бутстреп-реплик" дерева, при значении параметра -test b по умолчанию), fdnaml (получение скобочных структур для каждого дерева) и fconsense (вычисление "консенсусного" дерева).

    fseqboot list.fasta -auto
    fdnaml list.fseqboot -ttratio 1 -auto
    fconsense list.treefile

    Получено неукорененное дерево:

                    +--------------------B
             +100.0-|
             |      |      +-------------A
             |      +100.0-|
      +------|             |      +------E
      |      |             +100.0-|
      |      |                    +------F
      |      |
      |      +---------------------------D
      |
      +----------------------------------C
     

    Полученное дерево совпадает с реальным. Бутстреп-значения всех внутренних ветвей равны 100, то есть эти ветви вошли во все бутстреп-реплики дерева. Таким образлм, не вошедших в конечное дерево ветвей (с малыми бутстреп-значениями) нет:

    
      Sets included in the consensus tree
      
      Set (species in order)     How many times out of  100.00
      
      ..****                     100.00
      ...***                     100.00
      ...**.                     100.00
      
      
      Sets NOT included in consensus tree: NONE
    

  6. Программа fdrawtree строит изображение неукорененного дерева (str.txt – его скобочная структура)

    fdrawtree str.txt drawtree.ps

    (иллюстрация исходного дерева)


©Семенюк Павел