Филогенетическое дерево

1. Дерево имеет следующую скобочную структуру: ((((А:20,B:20):10,C:30):5,(D:20,E:20):15):65,F:100);
Схема дерева:


2. Ветви как разбиение множество листьев этого дерева:
ABCDEF
...**.
**....
***...

3. Длина гена - 966 нт. Формула для подсчета кол-ва мутаций n: n = N * m / 100, где N - длина мутируемой последованости, m - длина ветви дерева.

Скрипт для создания мутантов:


4. Реконструкции схемы дерева
Мутантные последовательности были помещены в один файл all.fasta.
Реконструируем дерево алгоритмом максимального правдоподобия: fdnaml all.fasta -ttratio 1 -auto, all.fdnaml.
Реконструируем дерево алгоритмами UPGMA или Neighbor-joining:
Считаем попарные расстояния между последовательностями: fdnadist all.fasta -ttratio 1 -auto
Выходной файл all.fdnadist подаем на вход программе fneighbor:
1. Алгоритм NJ: fneighbor all.fdnadist -auto -outfile all.fneighbor
2. Алгоритм UPGMA: fneighbor all.fdnadist -treetype u -auto -outfile ali.fneighbor
Maximum LikenessNeighbor-joiningUPGMA
  +-----B         
  |  
  |     +-------------------------F 
  |  +--4  
  |  |  |   +---E
  1--2  +---3
  |  |      +----D
  |  |  
  |  +------C
  |  
  +----A  
  +-----B
  ! 
  !  +-----C
  !  ! 
  2--3     +----D
  !  ! +---1 
  !  +-4   +---E
  !    ! 
  !    +------------------------F           
  ! 
  +----A 
                        +-------A    
                  +-----1 
                +-3     +-------B  
                ! ! 
  +-------------4 +-------------C  
  !             ! 
  !             !     +--------D
--5             +-----2 
  !                   +--------E
  ! 
  +----------------------------F  

Разбиения для идентификации топологии
исходного и реконструированных деревьев.
ABCDEFOriMLNJUPGMA
...**.++++
**....++++
***...++++

Деревья, реконструированные с помощью NJ и MLб неукорененные, в отличие от UPGMA, т.к. последний алгоритм использует теорию молекулярных чесов и укореняет дерево посередине. Совпали с исходным деревом все реконструкции, что говорит о достоверности и применимости к данной модели эволции всех реконструкций.

5. Оценка достоверности реконструированной топологии с помощью бутстреп-анализа
Вначале создано 100 бутстреп-реплик: fseqboot all.fasta -auto
Затем созданы скобочные формулы: fdnaml all.fseqboot -ttratio 1 -auto -outfile bootall.fdnaml и построено консенсусное дерево (была запущена программа fconsense и подан ей на вход файл all.treefile)
Консенсусное дерево.
                       +------D  
                +-98.0-|
         +-64.0-|      +------E  
         |      |
  +------|      +-------------F  
  |      |
  |      |             +------A
  |      +--------96.0-|
  |                    +------B
  |
  +---------------------------C  

Original
ABCDEF
...**.
**....
***...
Consensus
ABCDEFR
...**.98.0
**....96.0
***...64.0

Консенсусное дерево совпало с исходным, и бутстреп-значения для двух его внутренних ветвей достаточно велики (96 и 98), и несмотря на недостаточно большое (около двух третей) значение для третьей ветви, ее значение также можно считать достоверным, т.е. реконструкция достоверна.

6. Исходное дерево в формате postscript.
Визуализировано с помощью команды: drawtree tree.treefile tree.ps -auto, в исходный файл была скопирована формула исходного дерева.
Хотя исходное дерево имело корень, визуализировано оно как неукорененное.



Главная страница > Четвертый семестр > Филогенетическое дерево


© Александра Далина