В итоге был получен файл cyb.phy с выравниваниями в нужном формате.
Построение дерева с помощью модели p-distance
Для начала было построено дерево алгоритмом fastme с расчётом расстояний через модель p-distance (число ошибок делить на длину):
# Дерево с помощью p-distance fastme-i cyb.phy -o cyb_p_dist.tree -pp-distance
Было получено дерево (рис. 1)
Рисунок 1. Дерево, построенное с помощью алгоритма fastme, модели p-distance. Укоренение проводилось вручную, опираясь на таксономическое дерево. Зелёные горизонтальные линии говорят о правильности состава клад. Красным и оранжевым прямоугольниками показаны организмы, которые оказались не в той кладе, в которой должны были быть. Фиолетовым отмечен организм, который располагается не в своей кладе и более базально, чем должен.
Это дерево похоже на таксономическое, однако есть ряд различий:
Отсутсвует калада (BRAPC,PARGO). Красным прямоугольником показан организм (PARGO), который оказался не там. Красным пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Организм LOXAA (помечен оранжевым прямоугольником) находится в другой базальной кладе кладе. Оранжевым пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Появилась лишняя клада (ASCSU,RHISA), из-за неверного расположения органима RHISA. Фиолетовым показано, где он должен располагаться;
Вертикальными зелёными линиями отмечены клады, которые были реконструированы правильно.
Построение дерева с помощью модели MtREV
Модель MtREV (Mitochondrial Reverse) используется для расчёта эволюционных расстояний и построения филогенетических деревьев митохондриальных белков. Она учитывает специфические частоты аминокислотных замен, характерные для митохондрий. Алгоритм построения - fastme.
# Дерево с помощью MtREV fastme-i cyb.phy -o cyb_p_dist.tree -pMtREV
Было получено дерево (рис. 2)
Рисунок 2. Дерево, построенное с помощью алгоритма fastme, модели MtREV. Укоренение проводилось вручную, опираясь на таксономическое дерево. Зелёные горизонтальные линии говорят о правильности состава клад. Красным и оранжевым прямоугольниками показаны организмы, которые оказались не в той кладе, в которой должны были быть. Фиолетовым отмечены организм, которые перепутаны местами. Салатовым обозначено "условно" правильная клада.
Дерево полученное этим способом кажется более правильным, он также есть неточности:
Салатовым отмечена "условно" правильная калада (BRAPC,PARGO). "Условно" правильной её было решено сделать в связи с наличием там организма ASCSU. Если бы его не было, токлада была бы верной;
Организм LOXAA (помечен оранжевым прямоугольником) находится в другой базальной кладе кладе. Оранжевым пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Красным прямоугольником показан организм ASCAU, который оказался не в той базальной кладе и образовал лишнюю кладу (ASCSU,PARGO). Красным пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Фиолетовым показаны организмы, у которых был перепутан порядок (менее базальный стал более базальным);
Вертикальными зелёными линиями отмечены клады, которые были реконструированы правильно.
Построение дерева с помощью программы IQ-Tree
По умолчанию используется информационный критерий Байеса. Сложняа программа, которая считает расстояния и исходя из некоторых алгоритмов выбтирает наиболее оптимальное.
# Дерево с помощью IQ-Tree iqtree-s cyb.phy
Было получено дерево (рис. 3)
Рисунок 3. Дерево, построенное с помощью программы IQ-Tree. Укоренение проводилось вручную, опираясь на таксономическое дерево. Зелёные горизонтальные линии говорят о правильности состава клад. Красным, оранжевым, фиолетовым, голубым, синим прямоугольниками показаны организмы, которые оказались не в той кладе или не в том месте.
Это дерево, по моему мнению, самое неудачное:
Голубым прямоугольником помечен организм TETBI, который оказался базальнее, чем должен быть. Голубым пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Организм LOXAA (помечен оранжевым прямоугольником) находится в другой базальной кладе вместе с организмом MYTED (синий прямоугольник). Оранжевым и синим пунктирами, заканчивающимися прямоугольниками, показаны места, где должен располагаться эти организмы;
Красным прямоугольником показан организм PARGO, который оказался не в той базальной кладе и образовал лишнюю кладу (ARTSF,PARGO). Красным пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Фиолетовым показаны организм RHISA, который распалагается слишком базально. Фиолетовым пунктиром, заканчивающимся прямоугольником, показано место, где должен располагаться этот организм;
Вертикальными зелёными линиями отмечены клады, которые были реконструированы правильно.
Во всех случаях наблюдается проблема с LOXAA и RHISA, а также часто проблемы с PARGO. Интересно изучить, почему это так.