На первую страницу третьего семестра

Анализ филогении деревьев с помощью алгоритмов Bootstrap и Jackknife

Здесь наша задача состоит в том, чтобы проверить правильность деревьев, построенных на основе множественного выранивания последовательностей, с помощью алгоритмов Bootstrap и Jackknife

JACKKNIFE


                       +------DXR C.
         +--------98.0-|
         |             +------DXR D.
  +------|
  |      |             +------DXR A.
  |      |      +-96.0-|
  |      +-58.0-|      +------DXR B.
  |             |
  |             +-------------DXR F.
  |
  +---------------------------DXR E.

BOOTSTRAP


  +---------------------------DXR E.
  |
  |                    +------DXR D.
  |      +--------98.0-|
  |      |             +------DXR C.
  +------|
         |             +------DXR B.
         |      +-99.0-|
         +-61.0-|      +------DXR A.
                |
                +-------------DXR F.


Можно сделать такие наблюдения: оба алгоритма генерируют одинаковое по топологии консенсусное дерево, при том что оно соответствует реальной эволюционной модели.

Реконструированные деревья по топологии в точности соответствуют тем, которые были восстановлены почти всеми (за исключением UPGMA) методами, использованными ранее при построении филогенетических деревьев.

Данные алгоритмы имеют большое преимущество в том, что они позволяют реконструировать помимо ветвей консенсусного дерева и менее "популярные ветви", которые могут как раз отвечать реальной картине мира.

Сами алгоритмы отличаются друг от друга разве только способом построения выравниваний, с помощью которых и строятся 100 деревьев.

Для этого используются такие программы:

seqboot- для построения множественных выравниваний, состоящих из случайно выбранных столбцов исходного выравнивания. В случае Bootstrap это выравнивания той же длины, столбцы которых получают последовательным произвольным выбором из столбцов исходного, а в случае Jackknife - выравнивания половинной длины, из каждого из которых случайным образом выкинули половину столбцов;

dnaml- построение 100 деревьев по созданным репликам. Для построения деревьев используется метод Maximum Likelihood;

consense - для построения консенсусного дерева, т.е. такого, ветви которого встречаются в большинстве деревьев;

Цифры, которыми подписаны ветви, показывают число деревьев из ранее построенных 100, в которых встретилась данная ветвь.