На главную страницу сайта
На главную страница четвертого семестра
 

Филогенетические деревья. Реконструкция

 

Оценка достоверности реконструированной топологии с помощью бутстреп-анализа

Для проведения бутстреп-анализа необходимо создать бутстреп-реплики - выравнивания, столбцы которых получают последовательным произвольным выбором из столбцов исходного (схема "выбор с возвращением"). Этим занимается программа fseqboot (с параметрами по умолчанию длина реплик равна длине выравнивания). Далее при помощи программы fdnaml по данным репликам реконструируются деревья. И вот теперь программа fconsense проводит собственно бутстреп-анализ. В результате она выдает файл со скобочной структурой консенсусного дерева и отчет.

Построенное консенсусное дерево полностью соответствует реальному:

                       +------A
         +--------58.0-|
         |             +------B
  +------|
  |      |      +-------------D
  |      +-83.0-|
  |             |      +------F
  |             +100.0-|
  |                    +------E
  |
  +---------------------------C

Далее представлены бутстреп-значения для ветвей этого дерева:
A B C D E F
- - * * * *     58
- - - * * *     83
- - - - * *     100                   

Эти значения показывают, сколько раз данная ветвь вошла в набор из ста деревьев. Таким образом, ветвь ABCD-EF появилась во всех деревьях, и её можно назвать самой достоверной. Значение для ABC-DEF ниже, но достаточно, чтобы считать эту ветвь надежной. Ветвь AB-CDEF уже вызывает сомнения, но если учесть, что бутстреп-значение для следующей ветви (BC-ADEF) равно 34, на неё ещё можно положиться.

 

Изображение филогенетического дерева в графическом формате

Визуализацию дерева по скобочной формуле реализует программа fdrawtree. Интересно, что выданный postscript-файл содержал ошибку, которая привела к тому, что ветвь А оказалась неподписанной. Пришлось доделывать это вручную:

В целом дерево правильное, но подобные "баги" в программе настораживают.

Оценка достоверности топологии с помощью метода jackknife

На этот раз бутстреп-анализ был проведен с использованием реплик, построенных методом jackknife. Отличие его от Bootstrep в том, что реплики имеют длину в 2 раза меньше, чем исходное выравнивание. Его результаты оказались гораздо лучше. Вот какие бутстреп-значения приписаны ветвям дерева:

A B C D E F
- - * * * *     90
- - - * * *     100
- - - - * *     100                   

И лишь одна ветвь (со значением 10) оказалась лишней (при использовании предыдущего метода таких ветвей было 6).
Трудно судить, исходя из одного положительного результата, но есть вероятность, что метод jackknife лучше подбирает реплики для проведения бутстреп-анализа.

Укоренение дерева в среднюю точку

Использовалась программа fretree. Для укоренения в среднюю точку использовалась опция M. Построенное дерево выглядит так:

                                ,-------------------------------------4:E
  ,----------------------------10
  !                             `------------------------------------------5:F
  !
-11                 ,---------------------------------6:A
  !           ,-----7
  !  ,--------8     `---------------------------------1:B
  !  !        !
  `--9        `-------------------------------------------------------------2:C
     !
     `--------------------------------------------------------3:D
Укоренение (по крайней мере по топологии) соответствует истинному дереву, хотя на практике результат зависит от того, ультраметрично дерево или нет. И хотя наше дерево таковым не является, расстояния от корня до листьев в нем различаются не сильно, поэтому fretree выдала вполне адекватный результат.

Для визуализации этого дерева была использована программа fdrawgram с опцией -style p, строящая ориентированную вправо филограмму. На изображении длины ветвей различны, так как соответствуют эволюционным расстояниям. Как уже говорилось, дерево по топологии полностью соответствует исходному.
Основное отличие fdrawgram от fdrawtree заключается в его разнообразии представлений деревьев (кладограмма, филограмма, курвиграмма, эурограмма, свупиграмма и круговое дерево). Но, хотя fdrawtree может строить лишь один тип деревьев, он обладает весьма полезной опцией -iterate, с помощью которой можно значительно улучшить визуальное представление дерева.

Восстановление предковой последовательности

Для реконструкции последовательностей, соответствующих узлам и корню дерева, необходимо указать это в опции -hypstate программы fdnamlk Кроме того, в нашем случае известно соотношение транзиции и трансверсии - 1, что также стоит указать в опции -ttratio (по умолчанию - 2). Выходной файл содержит построенное дерево (построено и укоренено верно), длины ветвей и выравнивание всех последовательностей (листья, узлы, корень).
Последовательность общего предка соответствует корню и находится под номером 4. Было проведено выравнивание её с исходным "настоящим" предком - геном btuB. Для построения выравнивания без гэпов программе needle был задан большой штраф за открытие гэпа.
Идентичность выравнивания составила 66%, что недостаточно для хорошего предсказания последовательности. К тому же fdnamlk "хитрит", используя вырожденные основания, которые выравниваются лучше.

 

 

 

 


© Донченко Иван, 2008