Целью данного практикума было построить филогенетические деревья тремя способами и сравнить их с деревом, полученным в практикуме 1 данного семестра
Для построения первых двух деревьев была применена программа fastme, при этом эволюционные расстояния оценивались двумя способами - как p-distance и с помощью модели MtREV. Ниже описаны команды, исполненные на сервере Kodomo
создание файла cyblist, содержащего идентификаторы цитохромов B для животных из практикума 1
получение файла cyb.fasta с последовательностями этих белков в формате fasta: seqret @cyb.list cyb.fasta
выравнивание последовательностей программой muscle: muscle -align cyb.fasta -output cyb-alignment.fasta
перевод из формата fasta в формат phylip-relaxed, используемый Fastme, для этого был использован код на Python, получен файл cyb.phy
реконструкция дерева с использованием p-distance: fastme -i cyb.phy -pp-distance -o p-distance
реконструкция дерева с использованием MtREV: fastme -i cyb.phy -pMtREV -o MtREV
визуализация деревьев с помощью iTOL
Для построения третьего дерева была применена программа IQ-Tree, которой на вход также был подан файл cyb.phy. На сервере Kodomo испольнялась команда iqtree -s cyb.phy
, результатом работы которой стало несколько файлов, из которых для визуализации дерева в iTOL использовался файл cyb.phy.treefile.
Ниже представлены полученные филогенетические деревья, а также их сравнение с референсным деревом из практикума 1.
При сравнении с референсным деревом были выявлены следующие отличия от референсного дерева:
общее для всех трех деревьев: отхождение ветви APILI (организм Apis melifera - медоносная пчела) на всех построенных деревьях происходит раньше, чем на референсном; с точки зрения систематики организмов это неверно, поскольку с точки зрения филогенетики медоносная пчела относится к кладе Насекомые, и ветвь с этим организмом должна отходить после ветви с ракообразным (рачок Artemia, ARTSF).
для дерева на основе p-distance, построенного FastME: положение ветви BOACO (Boa Constrictor) не соответствует реальной систематике - ветвь с обыкновенным удавом убежала к беспозвоночным ;)
для дерева на основе MtREV, построенного FastME: длина ветви BOACO существенно больше других ветвей, возможно это связано с наибольшим количеством отличий в последовательности белка этого организма и тем, как алгоритм обработал эти отличия
для дерева, построенного IQ-Tree: очень большая длина ветви BOACO также обращает на себя внимание