Учебный сайт Кирилла Цуканова → Четвертый семестр

Алгоритмы реконструкции деревьев

1. Укоренение в среднюю точку

Напоминаем, правильное дерево:

Дерево, построенное методом Neighbour-Joining по BLOSUM62:

После переукоренения программой retree в среднюю точку получилось еще хуже:

Укоренение произошло в ветвь {CLOB1,STAES} vs. {LACDA,ENTFA,STRPN,LISMO,GEOKA,BACAN}. Такое укоренение, конечно, нельзя считать правильным. Если только Clostridia не согласятся приветствовать нового члена своего общества — Staphylococcus epidermidis. Вообще эта бактерия вместе с Lactobacillus delbrueckii вечно портит всю картину.

Деревья, построенные методом UPGMA, ультраметричны. Поэтому тому, кто захочет найти путь от листа к листу с наибольшей длиной, можно только пожелать удачи. Можно сказать, дерево уже укоренено в свою среднюю точку.

2. Использование внешней группы

Деревья, построенные методом максимальной экономии, невозможно укоренить, потому что алгоритм вообще не выдает длины ветвей. Только топология, только хардкор.

Белок из кишечной палочки был добавлен к остальным восьми (seq_ecoli.fasta), выровнен с помощью Muscle (seq_ecoli_aligned.fasta), и затем у него были удалены начальные и концевые неполные участки и одновременно отредактированы имена (seq_ecoli_cut.fasta). Результат был импортирован в MEGA, построено дерево методом максимальной экономии, укоренено в ветвь, ведующую к кишечной палочке, и экспортировано:

Не так плохо, но все равно Lactobacillales включаются в Bacillales вместо того, чтобы быть равноправной с ними группой. Тем не менее, укоренение произошло в правильную ветвь (CLOB1 против всех остальных).

Бутстрэп

Для бутстрэп-анализа возьмем оригинальный набор выровненных последовательностей без кишечной палочки (seq_aligned.fasta). Деревья, построенные обычным способом (я выбрал Neighbour-Joining) и с помощью бутстрэп-анализа, ничем не отличаются. При этом (неправильная) ветвь, выделяющая отдельно CLOB1 и STAES, имела поддержку в 96 случаях из 100. (Укоренять дерево не стал, чтобы можно было видеть процентп поддержки ветви CLOB1+STAES против всех остальных.) В остальном дерево совершенно верное, только стафилококк должен входить в состав Bacillales, а не быть отдельным инопланетным существом.