A | B | C | D | E | F |
. | . | * | * | * | * |
. | . | * | * | * | . |
. | . | * | * | . | . |
msbar syk1_ecoli_gene1.fasta ab.fasta -point 4 -count 153 -auto msbar ab.fasta A.fasta -point 4 -count 1221 -auto msbar ab.fasta B.fasta -point 4 -count 1221 -auto msbar syk1_ecoli_gene1.fasta cdef.fasta -point 4 -count 75 -auto msbar cdef.fasta cde.fasta -point 4 -count 687 -auto msbar cde.fasta cd.fasta -point 4 -count 412 -auto msbar cd.fasta C.fasta -point 4 -count 504 -auto msbar cd.fasta D.fasta -point 4 -count 504 -auto msbar cde.fasta E.fasta -point 4 -count 764 -auto msbar cdef.fasta F.fasta -point 4 -count 1451 -auto
Цель задания построить деревья на основе данных конечных
последовательностей (листьев), и сравнить результаты.
В результате реконструкции дерева алгоритмом максимального правдоподобия с помощью программы fdnaml
(команда fdnaml all.fasta -ttratio 1 -auto) было получено следующее
"текстово-графическое" изображение дерева:
+--------------------b | | +---------------------f 1---4 | | +----------e | +-------------3 | | +-------d | +-------2 | +-------c | +----------------a
+--------------------b ! ! +--------c ! +--------1 ! +--------------2 +-------d ! ! ! 3---4 +----------e ! ! ! +----------------------f ! +----------------a
+------------------------------------a +--------3 +-----4 +------------------------------------b ! ! ! +---------------------------------------------f --5 ! +---------------c ! +----------1 +------------------------2 +---------------d ! +--------------------------e
Для сравнение предложено было сделать таблицу, в левой части которой приведены (в виде точек и звёздочек) все ветви,
встреченные во всех деревьях (исходном и трёх реконструкциях), а в правой добавлены четыре столбца, соостветствующие
четырём деревьям. Знаком + отмечено, в каких деревьях встретилась каждая из ветвей.
A | B | C | D | E | F | правильное дерево | 1ое | 2ое | 3ее |
. | . | * | * | * | * | + | + | + | + |
. | . | * | * | * | . | + | + | + | + |
. | . | * | * | . | . | + | + | + | + |
Несмотря на то, что в данном случае все алгоритмы выдали правильный результат, надежнее было бы использовать методы UPGMA и Neighbor-joining
Деревья получаются путем последовательного применения трех программ из пакета PHYLIP:
Выходной файл all.fconsense содержит следующее неукорененное дерево:
+--------------------e | +100.0-| +------b | | +-93.0-| | +100.0-| +------a +------| | | | +-------------f | | | +---------------------------d | +----------------------------------c
Реальные данные:
Результаты бутстеп-анализа:
A | B | C | D | E | F | сколько раз встречается (из 100) |
. | . | * | * | * | * | 93 |
. | . | * | * | * | . | 100 |
. | . | . | . | * | * | 100 |
Топология воссоздана правильно.
© Долудин Юрий, 2005