Практикум 2. Филогенетическая реконструкция и сравнение деревьев

В ходе предыдущей работы было построено дерево, отражающее общепринятую таксономию видов (рис. 1). Оно будет служить референсом для сравнения с филогенетическими деревьями, реконструированными на основе последовательностей белка цитохрома Б (рис. 2–4) с помощью различных алгоритмов.

Картинка
Рисунок 1. Филогенетическое дерево исследуемых организмов, сделанное по их таксономии. Используется как референс.

На рис. 2 и 3 изображены деревья, построенные программой FastME, с использованием разных моделей для оценки расстояний между последовательностями (деревья были укоренены в ветвь, отделяющую группы лепидозавров и птиц): FastME основан на принципе сбалансированной минимальной эволюции — том же самом, что лежит в основе метода NJ. Однако FastME улучшает NJ за счёт использования быстрых и сложных алгоритмов для перестроения топологии дерева. Первая версия FastME поддерживала только перестановки ближайших соседей (NNI).

а) p-distance (рис. 2). Эта модель считает расстояние между последовательностями как (число отличий)/(длину последовательности). Как можно видеть из рисунка, полученное дерево полностью совпадает с эталонным по расположению групп.

Картинка
Рисунок 2. Филогенетическое дерево исследуемых организмов, реконструированное программой FastME, моделью p-distance.

б) MtREV (рис. 3). MtREV считает расстояние между последотвальностями, используя модель замещения аминокислот в митохондриальных белках многоклеточных организмов. При сравнении его с референсным деревом различий по составу групп также нет.

Картинка
Рисунок 3. Филогенетическое дерево исследуемых организмов, реконструированное программой FastME, моделью MtREV.

Стоит заметить, что деревья, полученные с помощью моделей p-distance и MtREV, оказались очень похожи друг на друга и совпадают с референсом.

На рис. 4 изображено дерево, построенное программой IQTree с параметрами по умолчанию (укоренение также было проведено в ветвь, отделяющую группы лепидозавров и птиц). Для реконструкции филогенетических деревьев методом максимального правдоподобия (ML) по выровненным последовательностям используется стохастический алгоритм.

Картинка
Рисунок 4. Филогенетическое дерево исследуемых организмов, построенное программой IQTree.

Дерево, построенное программой IQTree, довольно сильно отличается от деревьев, сделанных программой FastME с обеими моделями, и референса. Первое, что бросается в глаза, - это то, что группа Neoaves (CARPF, FALSP, FALFE) оказалась внутри ветви курообразных (Galloanserae; CHICK, SERRE и GALLA), что не является правдой. Из референса видно, что они являются сестринскими группами по отношению друг к другу. Также на этом дереве CHICK выделяется в отдельную ветвь в отрыве от отряда курообразных, что также не совпадает с референсом. Эволюция группы лепидозавров (Lepidosauria; BOACO, ERYEL, LATCO, MICFL) отражена правильно, в соответствии с референсом. Никаких отличий по составу этой группы нет.


Программа FastME с моделями p-distance и MtREV реконструировала наиболее правдоподобные филогенетические деревья, в то время как IQTree справилась с этой задачей гораздо хуже.