Практикум 2. Алгоритмы филогенетической реконструкции


Целью данного практикума было построить филогенетические деревья тремя способами и сравнить их с деревом, полученным в практикуме 1 данного семестра

Для построения первых двух деревьев была применена программа fastme, при этом эволюционные расстояния оценивались двумя способами - как p-distance и с помощью модели MtREV. Ниже описаны команды, исполненные на сервере Kodomo

  • создание файла cyblist, содержащего идентификаторы цитохромов B для животных из практикума 1

  • получение файла cyb.fasta с последовательностями этих белков в формате fasta: seqret @cyb.list cyb.fasta

  • выравнивание последовательностей программой muscle: muscle -align cyb.fasta -output cyb-alignment.fasta

  • перевод из формата fasta в формат phylip-relaxed, используемый Fastme, для этого был использован код на Python, получен файл cyb.phy

  • реконструкция дерева с использованием p-distance: fastme -i cyb.phy -pp-distance -o p-distance

  • реконструкция дерева с использованием MtREV: fastme -i cyb.phy -pMtREV -o MtREV

  • визуализация деревьев с помощью iTOL

Для построения третьего дерева была применена программа IQ-Tree, которой на вход также был подан файл cyb.phy. На сервере Kodomo испольнялась команда iqtree -s cyb.phy, результатом работы которой стало несколько файлов, из которых для визуализации дерева в iTOL использовался файл cyb.phy.treefile.

Ниже представлены полученные филогенетические деревья, а также их сравнение с референсным деревом из практикума 1.

Рис.1 Дерево на основе p-distance, построенное FastME

Рис.2 Дерево на основе MtREV, построенное FastME

Рис.3 Дерево, построенное IQ-Tree

При сравнении с референсным деревом были выявлены следующие отличия от референсного дерева:

  • общее для всех трех деревьев: отхождение ветви APILI (организм Apis melifera - медоносная пчела) на всех построенных деревьях происходит раньше, чем на референсном; с точки зрения систематики организмов это неверно, поскольку с точки зрения филогенетики медоносная пчела относится к кладе Насекомые, и ветвь с этим организмом должна отходить после ветви с ракообразным (рачок Artemia, ARTSF).

  • для дерева на основе p-distance, построенного FastME: положение ветви BOACO (Boa Constrictor) не соответствует реальной систематике - ветвь с обыкновенным удавом убежала к беспозвоночным ;)

  • для дерева на основе MtREV, построенного FastME: длина ветви BOACO существенно больше других ветвей, возможно это связано с наибольшим количеством отличий в последовательности белка этого организма и тем, как алгоритм обработал эти отличия

  • для дерева, построенного IQ-Tree: очень большая длина ветви BOACO также обращает на себя внимание