Занятие 3. Алгоритмы реконструкции деревьев.



Задание 1. Укоренение в среднюю точку.

Укоренять имеет смысл то дерево, в котором указаны длины ветвей и нет корня, поэтому для данного задания подходит дерево, полученное программой fneighbor методом neighbor-joining, при методе UPGMA мы уже имеем укоренённое ультраметрическое дерево с длинами ветвей.

Если предположить равные темпы эволюции по всем ветвям дерева, то корень помещаем по середине самого длинного "маршрута". Однако метод максимальной экономии (maximum parsimony), направленный на анализ данных о последовательностях, определяет оптимальное дерево так, чтобы минимизировать колличество мутаций. При этом как таковых расстояний между листьями нет, поэтому не возможно выбрать самый длинный маршрут и произвести укорените в среднюю точку.

Дерево укоренненное в среднюю точку, с помощью программы retree пакета PHYLIP
(при использовании функции M("Midpoint root the tree")):

Верное дерево:

Как видно из изображений деревьев, они идентичны: совпали все ветви. Укоренение оказалось верным: в ветвь {FINM2, CLOTE} vs {LACDA, LACAC, LACLM, STRPN, BACSU, BACAN}

Задание 2. Использование внешней группы

Построим выравнивание с добавлением белка от Ecoli.
seqret sw:efg_ecoli stdout >> protein.fasta
muscle -in protein.fasta -out aligned_protein.fasta

Полученное дерево, обработанное программой retree, с указанием в качестве действия "select an Outgroup":

Изображение с внешней группой:


Дерево укоренненное при помощи внешней группы (изображение без внешней группы)

Верное дерево

Снова программа запуталась с CLOTE и FINM2. Снова вместо {LACDA, LACAC, LACLM, STRPN} vs {FINM2, CLOTE, BACSU, BACAN} присутствует ветвь {LACLM, STRPN, BACSU, BACAN} vs {FINM2, CLOTE, LACDA, LACAC}

Бутстрэп

Провели бутстрэп-анализ филогении, используя программу fprotpars.Этапы работы:
fseqboot aligprot.fasta aligprot.fseqboot - создаем файл с 100 бутстрэп-реплик выравнивания белков
fprotpars aligprot.fseqboot -outtreefile aligprot.treefile -outfile aligprot.fprotpars - создаем по полученным репликам деревья
fconsense aligprot.treefile aligprot.fconsense - создаем из полученных деревьев единое дерево по принципу "расширенного большинства" (extended majority rule tree)


 +---------------------------------------STRPN
  |
  |                               +-------FINM2
  |                       +-100.0-|
  |                       |       +-------CLOTE
  |               +--65.0-|
  |               |       |       +-------LACAC
  |               |       +-100.0-|
  |       +--99.5-|               +-------LACDA
  |       |       |
  |       |       |               +-------BACAN
  +-------|       +----------86.5-|
          |                       +-------BACSU
          |
          +-------------------------------LACLM

Это дерево еще меньше похоже на верное. Например, в верном нет ветви с поддержкой 65.0, а вследсвие этого нет и ветви 99.5. Это дерево также отличается от дерева, построенного fprotpars на исходном выравнивании:

 
                  +--STRPN 
               +-----7        
               !     +--LACLM 
         +-----6              
         !     !     +--BACSU 
         !     +-----5        
      +--4           +--BACAN 
      !  !                    
      !  !           +--LACDA 
   +--2  +-----------3        
   !  !              +--LACAC 
   1  !                       
   !  +-----------------CLOTE 
   !                          
   +--------------------FINM2  

Ветви, не получившие большинства

Species in order: 

  1. STRPN
  2. LACLM
  3. BACSU
  4. BACAN
  5. LACDA
  6. LACAC
  7. CLOTE
  8. FINM2
                           
..**..**    35.00        # ее нет в дереве от fprotpars, но эта ветвь присутствуе в верном дереве
...*..**    13.50        # ее нет в обоих деревьях
.*..**..     0.50        # ее нет в обоих деревьях


© SHADRINA О. А. 2010