Ветви дерева как разбиения множества листьев (считая дерево бескорневым) описываются так:
A B C D E F * * * . . . * * . . . . * * * * . .Были получены искуственные мутантные последовательности, соответствующие листьям и узлам дерева, считая, что в корне находится нуклеотидная последовательность с EMBL ID J01591 из генома Escherichia coli. Длина гена: 2107 нуклеотидов. Формула для пересчёта расстояний в число мутаций: длина гена*расстояние от узла/100 Текст скрипта, которым получаются мутантные последовательности:
msbar aroGgene.fasta ABC.fasta -point 4 -count 1264 -auto msbar ABC.fasta C.fasta -point 4 -count 843 -auto msbar ABC.fasta AB.fasta -point 4 -count 421 -auto msbar AB.fasta A.fasta -point 4 -count 421 -auto msbar AB.fasta B.fasta -point 4 -count 421 -auto msbar aroGgene.fasta DEF.fasta -point 4 -count 843 -auto msbar DEF.fasta D.fasta -point 4 -count 1264 -auto msbar DEF.fasta EF.fasta -point 4 -count 105 -auto msbar EF.fasta E.fasta -point 4 -count 632 -auto msbar EF.fasta F.fasta -point 4 -count 632 -auto
Ветви деревьев | Neighbor-Joining | UPGMA | Алгоритм максимального правдоподобия | 1-ое |
Выходные файлы | Neighbor-Joining | UPGMA | Алгоритм максимального правдоподобия | |
ABCDEF | +----B ! ! +--------С ! ! 1-----2 +--------------D ! ! +--3 ! +---------------------------4 +-------E ! ! ! +----F ! +----A |
+---------A +---------1 +----------------------------3 +---------B ! ! ! +-------------------C --5 ! +----------------------D +-------------------------4 ! +--------------E +-------2 +--------------F |
+-------C | +-------1 +-------F | | +----3 | +-----------------------------------2 +--------E | | | +------------D | 4----B | +-----A |
|
* * * . . . | + | + | + | + |
* * . . . . | + | + | + | + |
* * * * . . | - | + | + | + |
* * * . . * | + | - | - | - |
Этапы работы:
1. Программой fseqboot были созданы 100 бутстреп-реплик выравнивания: fseqboot ali.fasta -auto (результат в файле ali.fseqboot).
2. Подали полученные 100 выравниваний на вход программе fdnaml. В выходном файле (ali.treefile) 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.
3. Запустили программу fconsense. В выходной файл помещены результаты бутстреп-анализа.
На нем цифрами отмечено количество раз, которое встречается данная ветка в 100 деревьях, построенных по выравниваниям, сделанным с помощью бутстрепа.
+-------------F +100.0-| | | +------E | +-73.0-| +------| +------D | | | | +------A | +-------100.0-| | +------B | +---------------------------CОно не соответствует тем результатам, которые были получены с помощью 3 методов построения деревьев, а соответствует дереву, полученному с помощью Neighbor-Joining. С реальным деревом по топологии оно не совпадает, поэтому бутстреп-анализ нельзя считать достаточно достоверным. Видно, что две большие ветви определены верно, но на третьей ступени ошибка. В консенсус не была включена правильная ветвь, т.к. она встретилась только в 25 деревьях из 100, а это очень мало.
Это дерево было нарисовано по заданной скобочной формуле, поэтому оно отражает модель реальных событий.