Ветви дерева как разбиения множества листьев (считая дерево бескорневым) описываются так:
A B C D E F * * * . . . * * . . . . * * * * . .Были получены искуственные мутантные последовательности, соответствующие листьям и узлам дерева, считая, что в корне находится нуклеотидная последовательность с EMBL ID J01591 из генома Escherichia coli. Длина гена: 2107 нуклеотидов. Формула для пересчёта расстояний в число мутаций: длина гена*расстояние от узла/100 Текст скрипта, которым получаются мутантные последовательности:
msbar aroGgene.fasta ABC.fasta -point 4 -count 1264 -auto msbar ABC.fasta C.fasta -point 4 -count 843 -auto msbar ABC.fasta AB.fasta -point 4 -count 421 -auto msbar AB.fasta A.fasta -point 4 -count 421 -auto msbar AB.fasta B.fasta -point 4 -count 421 -auto msbar aroGgene.fasta DEF.fasta -point 4 -count 843 -auto msbar DEF.fasta D.fasta -point 4 -count 1264 -auto msbar DEF.fasta EF.fasta -point 4 -count 105 -auto msbar EF.fasta E.fasta -point 4 -count 632 -auto msbar EF.fasta F.fasta -point 4 -count 632 -auto
| Ветви деревьев | Neighbor-Joining | UPGMA | Алгоритм максимального правдоподобия | 1-ое |
| Выходные файлы | Neighbor-Joining | UPGMA | Алгоритм максимального правдоподобия | |
| ABCDEF | +----B ! ! +--------С ! ! 1-----2 +--------------D ! ! +--3 ! +---------------------------4 +-------E ! ! ! +----F ! +----A |
+---------A
+---------1
+----------------------------3 +---------B
! !
! +-------------------C
--5
! +----------------------D
+-------------------------4
! +--------------E
+-------2
+--------------F
|
+-------C
|
+-------1 +-------F
| | +----3
| +-----------------------------------2 +--------E
| |
| +------------D
|
4----B
|
+-----A
|
|
| * * * . . . | + | + | + | + |
| * * . . . . | + | + | + | + |
| * * * * . . | - | + | + | + |
| * * * . . * | + | - | - | - |
Этапы работы:
1. Программой fseqboot были созданы 100 бутстреп-реплик выравнивания: fseqboot ali.fasta -auto (результат в файле ali.fseqboot).
2. Подали полученные 100 выравниваний на вход программе fdnaml. В выходном файле (ali.treefile) 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.
3. Запустили программу fconsense. В выходной файл помещены результаты бутстреп-анализа.
На нем цифрами отмечено количество раз, которое встречается данная ветка в 100 деревьях, построенных по выравниваниям, сделанным с помощью бутстрепа.
+-------------F
+100.0-|
| | +------E
| +-73.0-|
+------| +------D
| |
| | +------A
| +-------100.0-|
| +------B
|
+---------------------------C
Оно не соответствует тем результатам, которые были получены с помощью 3 методов построения деревьев, а соответствует дереву, полученному с помощью Neighbor-Joining. С реальным деревом по топологии оно не совпадает, поэтому бутстреп-анализ нельзя считать достаточно достоверным. Видно, что две большие ветви определены верно, но на третьей ступени ошибка. В консенсус не была включена правильная ветвь, т.к. она встретилась только в 25 деревьях из 100, а это очень мало.
Это дерево было нарисовано по заданной скобочной формуле, поэтому оно отражает модель реальных событий.