Tuesday, March 14, 2017. Posted by Marina Gladkova

Evolutionary trees.

Задание 1. Укоренение в среднюю точку.



С помощью функции M программы retree пакета PHYLIP дерево енолаз было переукоренено в среднюю точку. На выходе был получен файл "outtree", переименнованный в "ENO_after_retree_tree.tre". Ниже представлены соответствующие изображения из MEGA.

Переукорененное дерево с указанием длины ветвей



Переукорененное дерево с отражением только топологии


Следует отметить, что при построении деревьев (как до, так и после переукоренения) с учетом длин ветвей получаются небинарные деревья, чего можно избежать при построении с учетом лишь топологии. Результаты укоренения в среднюю точку совпали с результатами прошлого практикума, а именно укоронение произошло в тривиальную ветвь {CLOTE} vs. {FINM2, ENTFA, GEOKA, BASCU, STAAR, STAES}. Вряд ли данную гипотезу можно принять как верную, потому как максимальную длину в построении до переукоренения имеет ветвь с листом FINM2 (14.801), указанная же ветвь, с листом CLOTE, имеет максимальную длину в построении после переукоренения (16.724). А в эталонном дереве укоренение вообще уходит в нетривиальную ветвь {CLOTE, FINM2} vs. {ENTFA, GEOKA, BASCU, STAAR, STAES}. Что касается топологии, то она совпадает с таковой у дерева, полученного методом NJ.




Задание 2. Использование внешней группы.



В методе максимальной экономии (Maximum Parsimony, MP) не учитываются длины ветвей, а значит, невозможно найти самый длинный путь, чтобы переукоренить дерево в его среднюю точку. Для этого используют внешнюю (аут-) группу - кластер неблизкородственных организмов. Укоренение дерева белков ENO выбранных бактерий производилось с использованием в качестве аутгруппы енолазы Escherichia coli. По аналогии с предыдущим практикумом, было построено выравнивание указанных ранее последовательностей с добавленной последовательностью E. coli при тех же параметрах.

Дерево, построенное с использованием аутгруппы


По выравниванию в MEGA было реконструировано филогенетическое дерево методом MP. Корневой была выбрана ветвь, ведущая к ECOLI. С помощью функции "Show Subtree Separately" было получено нужное дерево без E. coli.

При сравнении этого дерева с эталонным не обнаруживаются следующие нетривиальные ветви: {CLOTE, FINM2} vs. {ENTFA, STAAR, STAES, GEOKA, BASCU}; {CLOTE, FINM2, ENTFA} vs. {STAAR, STAES, GEOKA, BASCU}, а бактерии ENTFA и (STAAR, STAES) объединены в общую кладу, которой нет ни в основном дереве, ни в деревьях, полученных методами NJ или переукоренением в среднюю точку, в двух последних, однако, встречается клада (ENTFA, (BACSU, GEOKA)). Вероятно, недостаточно судить о взаимосвях между выбранными организмами, основываясь только на анализе данного белка, потому как клада близкородственных енолах ((STAAR, STAES), (BACSU, GEOKA)) в различных алгоритмах по-своему разбивается в разрешенных деревьях. В таком случае приоритетно использование небинарных деревьев.




Задание 3. Bootstrap.



Bootstrap (дословно - петля на заднике ботинка) - практический компьютерный метод исследования распределения статистик, основанный на многократной генерации выборок методом Монте-Карло на базе имеющейся выборки. [1]

При построении дерева из исходного выравнивания создается множество «бутстрэп-реплик». В каждой реплике случайно выбранная половина столбцов заменяется на копии так же случайно выбранных других столбцов, для всех реплик строится дерево, а затем на базе "индивидуальных" деревьев строится общее методом расширенного большинства ("Extended majority-rule tree"). К дереву, построенному из ветвей, встретившихся в большинстве "индивидуальных" добавляются ветви, не противоречащие уже имеющимся, начиная с наиболее "поддержанных". Числа на ветвях обозначают количество «бутстрэп-реплик», в которых имеется та или иная ветвь.

Бутстрэп-анализ филогении белков был проведен в MEGA с использованием метода NJ. Число реплик равно 100.

Original tree



Consenus tree


Топология оригинального дерева:
1) {CLOTE, FINM2} vs. {ENTFA, STAAR, STAES, GEOKA, BASCU}
2) {CLOTE, FINM2, GEOKA, BACSU} vs. {ENTFA, STAAR, STAES}
3) {CLOTE, FINM2, GEOKA, BACSU, ENTFA} vs. {STAAR, STAES}

Топология консенсусного дерева:
1) {GEOKA, BACSU} vs. {FINM2, CLOTE, ENTFA, STAAR, STAES}
2) {GEOKA, BACSU, FINM2, CLOTE} vs. {ENTFA, STAAR, STAES}
3) {CLOTE, FINM2, GEOKA, BACSU, ENTFA} vs. {STAAR, STAES}

Таким образом, топология консесусного и оригинального деревьев различается (одна общая нетривиальная ветвь под номером 3). Несмотря на то, что укоренение в консенсусном дереве прошло в ранее нигде не встречавшуюся ветвь {GEOKA, BACSU} vs. {FINM2, CLOTE, ENTFA, STAAR, STAES} с поддержкой большей, чем у ветви, в которую укоренено original tree и само эталонное (98 реплик против 81 одной реплики), я считаю данную ветвь и укоренение ложными. При этом, ни одно из деревьев не совпадает с эталонным.

*И вообще, все-все деревья хоть одной ветвью, да отличаются, ПРИЧИНА? (Подумать)

Источники