Все находки объединил в файл best_hits_seqs, оставив в заголовках только идентификаторы.
На сайте NGPhylogeny проводилась филогенетическая реконструкция, использовав MAFFT и FastME c параметрами: "Gamma distributed rates across sites" — No, "Starting tree" — BIONJ, "No refinement", 100 бутстреп реплик.
Основываясь на предположении, что филогенетическая реконструкция верна, можно найти пары ортологов и паралогов. Они представлены в Таблице 1
Таблица 1. Три пары ортологов и три пары паралогов в полученном дереве.
Ортологи
Паралоги
CLPX COREF и CLPX CORDI
CLPX COREF и Q8FMH5 COREF
Q8FMH5 COREF и Q6NFB1 CORDI
Q8FMH5 COREF и Q8FMG2 COREF
Q8FMG2 COREF и Q6NF92 CORDI
Q8FMG2 COREF и CLPX COREF
Далее я укоренил дерево в среднюю точку и покрасил ортологичные группы белков (Рис. 1). Группы, состоящие из трёх и меньше ортологов, покрашены в чёрный цвет. Также было добавлено отображение поддержек bootstrap.