Для объединения протеомов бактерий в один файл я использовал команду cat, затем запустил blastp с evalue 0.001 для поисков гомологов CLPX_ECOL. Ниже представлен результат работы алгоритма BLASTP.

Sequences producing significant alignments: Score (Bits) E-Value
sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding subun... 860 0.0
sp|A4XTZ6|CLPX_PSEMY ATP-dependent Clp protease ATP-binding subun... 658 0.0
sp|Q21KA8|CLPX_SACD2 ATP-dependent Clp protease ATP-binding subun... 645 0.0
sp|Q5P160|CLPX_AROAE ATP-dependent Clp protease ATP-binding subun... 619 0.0
sp|Q62JK8|CLPX_BURMA ATP-dependent Clp protease ATP-binding subun... 617 0.0
sp|A4SXD7|CLPX_POLAQ ATP-dependent Clp protease ATP-binding subun... 613 0.0
sp|A5FX05|CLPX_ACICJ ATP-dependent Clp protease ATP-binding subun... 583 0.0
sp|Q9JTX8|CLPX_NEIMA ATP-dependent Clp protease ATP-binding subun... 557 0.0
sp|Q21H71|HSLU_SACD2 ATP-dependent protease ATPase subunit HslU O... 99.8 7e-23
sp|P0A6H5|HSLU_ECOLI ATP-dependent protease ATPase subunit HslU O... 93.6 7e-21
sp|Q5P503|HSLU_AROAE ATP-dependent protease ATPase subunit HslU O... 93.6 9e-21
sp|A4XPN6|HSLU_PSEMY ATP-dependent protease ATPase subunit HslU O... 93.2 1e-20
tr|A5FYD7|A5FYD7_ACICJ ATP-dependent protease ATPase subunit HslU... 92.0 3e-20
sp|Q62F00|HSLU_BURMA ATP-dependent protease ATPase subunit HslU O... 82.4 5e-17
sp|P0AAI3|FTSH_ECOLI ATP-dependent zinc metalloprotease FtsH OS=E... 46.2 2e-05
tr|A5FVF9|A5FVF9_ACICJ ATP-dependent zinc metalloprotease FtsH OS... 44.7 7e-05
tr|A0A0H2WJ72|A0A0H2WJ72_BURMA ATP-dependent zinc metalloprotease... 43.9 1e-04
tr|A4SXL5|A4SXL5_POLAQ ATP-dependent zinc metalloprotease FtsH OS... 43.5 2e-04
sp|Q9JUB0|RUVB_NEIMA Holliday junction branch migration complex s... 42.7 2e-04
sp|P0ABH9|CLPA_ECOLI ATP-dependent Clp protease ATP-binding subun... 43.1 2e-04
tr|A0A0U1RJ22|A0A0U1RJ22_NEIMA Replication-associated recombinati... 40.8 0.001

Затем по данным выравнивания веб-сервисом NGPhylogeny.fr было построено дерево с помощью программы FastME. Файл с newick-записью дерева.

По построению дерева ортологичными являются белки: HSLU_AROAE и HSLU_BURMA, CLPX_ACICIJ и CLPX_POLAQ, HSLU_PSEMY и HSLU_SACD2. Паралогичными - FTSH_ECOLI и HSLU_ECOLI, HSLU_ECOLI и CLPX_ECOLI, CLPA_ECOLI и CLPX_ECOLI.

Рис.1 Дерево гомологов CLPX_ECOLI с несхлопнутыми кладами
Рис.2 Дерево гомологов CLPX_ECOLI со схлопнутыми ортологичными кладами. Верхняя клада содержит гены Hslu, кодирующие АТФ-азную субъединицу протеазы HslVU. Нижняя - гены Clpx, которые кодируют АТФ-азную субъединицу протеаззы Clp.