Филогенетические деревья -III. Укоренение и Bootstrap.
Укоренение в среднюю точку
При укоренении в среднюю точку на дереве ищется самое большое расстояние между двумя листьями, а его середина принимается за корень.
С помощью программы retree из пакета PHYLIP (использовалась версия, включённая в EMBOSS) дерево, построенное в предыдущем практикуме
с помощью алгоритма neighbour joining using % of identity было переукоренено в среднюю точку.
Результат и исходное дерево представлены соответственно на рис. 1 B и 1 А.
Рис. 1. Два варианта укоренения дерева последовательностей белка EF-Ts из семи различных фирмикут.
Использование внешней группы
В связи с тем, что метод maximum parsimony символьно-ориентированный и не выдаёт длины ветвей, дерево нельзя укоренить в среднюю точку.
Однако возможно использавть внешнюю группу - в данном случае, её роль исполняла последовательность того же белка из Escherivhia coli. Было построено множественное выравнивание всех восьми белков
(с помошью MUSCLE), затем дерево в программе MEGA по алгоритму maximum parsimony, которое далее укореняется в ветвь, соединяющую внешнюю группу с остальной частью дерева. Вид дерева вместе c ECOLI приведён на рис.2. Изображение укоренённого дерева без ECOLI
не приводится, т.к. оно идентично рисунку 7 из предыдущего практикума. Это закономерно, т.к. последовательность EF-Ts из клостридии (CLOTE) является внешней группой для всех бацилл, а изE.coli - для всех фирмикут.
Рис. 2. Дерево, построенное по алгоритму Maximum parsimony с использованием внешней группы.
Бутстрэп
Суть бутстреп-анализа состоит в том,
из выравнивания случайным образом удаляется часть колонок, удалённые столбцы заменяются на копии других столбцов, тоже выбранных случайно.
По такому выравниванию строится дерево. Затем операция повторяется.
После этого выбираются непротиворечивые узлы дерева, поддержанные наибольшим процентом деревьев.
Bootstrap-анализ белков был проведён с использованием метода UPGMA (число реплик было установлено равным 100).
На рис 3. можно увидеть дерево, построенное методом UPGMA (original) и полученное после анализа (bootstrap).
Как можно видеть, деревья отличаются только тем, что при бутстреп-анализе утратилась информация о длине ветвей. Любопытно отметить, что единственная правильная ветвь
на обоих деревьях имеет наименьшую поддержку.
Рис.3. Оригинальное и консенсусное деревья. Алгоритм построения оригинального дерева - UPGMA.