Составление списка гомологичных белков, включающих паралоги

Необходимо найти в бактериях из первого(второго) практикума достоверные гомологи белка CLPX_ECOLI.
Воспользуемся командой:
blastp -query P0A6H1.fasta -db all.fasta -out blast666.txt -evalue 0.001
На выход был получен Файл
Список находок из выдачи BLAST (без заголовка выдачи и выравниваний):
    Sequences producing significant alignments:                          (Bits)  Value

  sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding sub...   860    0.0
  sp|A8GAR0|CLPX_SERP5 ATP-dependent Clp protease ATP-binding sub...   806    0.0
  sp|B4EU54|CLPX_PROMH ATP-dependent Clp protease ATP-binding sub...   769    0.0
  sp|Q3SI99|CLPX_THIDA ATP-dependent Clp protease ATP-binding sub...   642    0.0
  sp|A4SXD7|CLPX_POLAQ ATP-dependent Clp protease ATP-binding sub...   613    0.0
  sp|Q6G3Z2|CLPX_BARHE ATP-dependent Clp protease ATP-binding sub...   588    0.0
  sp|Q165G0|CLPX_ROSDO ATP-dependent Clp protease ATP-binding sub...   582    0.0
  sp|Q6G5G0|HSLU_BARHE ATP-dependent protease ATPase subunit HslU...  97.1    4e-22
  sp|A8GL96|HSLU_SERP5 ATP-dependent protease ATPase subunit HslU...  96.7    7e-22
  sp|B4F171|HSLU_PROMH ATP-dependent protease ATPase subunit HslU...  96.7    7e-22
  sp|P0A6H5|HSLU_ECOLI ATP-dependent protease ATPase subunit HslU...  93.6    6e-21
  sp|Q16CY2|HSLU_ROSDO ATP-dependent protease ATPase subunit HslU...  93.6    7e-21
  tr|Q3SFW1|Q3SFW1_THIDA ATP-dependent protease ATPase subunit Hs...  86.7    2e-18
  tr|A8GCD8|A8GCD8_SERP5 ATP-dependent Clp protease, ATP-binding ...  51.6    4e-07
  tr|B4EV83|B4EV83_PROMH ATP-dependent Clp protease ATP-binding s...  50.1    1e-06
  tr|B4F2B3|B4F2B3_PROMH ATP-dependent zinc metalloprotease FtsH ...  46.6    1e-05
  sp|P0AAI3|FTSH_ECOLI ATP-dependent zinc metalloprotease FtsH OS...  46.2    2e-05
  tr|A8G901|A8G901_SERP5 ATP-dependent zinc metalloprotease FtsH ...  46.2    2e-05
  sp|Q168A2|RUVB_ROSDO Holliday junction ATP-dependent DNA helica...  45.4    2e-05
  tr|A0A0H3LXZ4|A0A0H3LXZ4_BARHE ATP-dependent zinc metalloprotea...  45.4    3e-05
  sp|Q6G5R1|RUVB_BARHE Holliday junction ATP-dependent DNA helica...  43.5    9e-05
  tr|Q3SJR4|Q3SJR4_THIDA ATP-dependent zinc metalloprotease FtsH ...  43.5    1e-04
  tr|A4SXL5|A4SXL5_POLAQ ATP-dependent zinc metalloprotease FtsH ...  43.5    1e-04
  sp|P0ABH9|CLPA_ECOLI ATP-dependent Clp protease ATP-binding sub...  43.1    2e-04
  tr|Q3SJH1|Q3SJH1_THIDA ATP-dependent Clp protease, ATP-binding ...  42.7    2e-04
  tr|Q16C81|Q16C81_ROSDO Chaperone protein ClpB OS=Roseobacter de...  41.2    6e-04
  tr|Q167Z2|Q167Z2_ROSDO ATP-dependent zinc metalloprotease FtsH ...  41.2    6e-04
  tr|Q3SKL1|Q3SKL1_THIDA Chaperone protein ClpB OS=Thiobacillus d...  40.8    0.001

Реконструкция и визуализация

Последовательности всех белков я выровнял в Muscle,и загрузил в MEGA-X. Построил с помощью Neighbour Joining дерево. В Newick-формате ссылка.
Полученное дерево:

Паралоги:
CLPX_BARHE и RUVB_BARHE
A4SXL5_POLAQ и CLPX_POLAQ
CLPX_ECOLI и FTSH_ECOLI
Ортологи:
CLPX_ECOLI и CLPX_SERP5
CLPX_THIDA и CLPX_BARHE
HSLU_SERP5 и HSLU_PROMH
Древо со схлопнутыми ортологичными группами:

Описание групп:
CLPX
Это субъединица АТФ-зависимой протеазы.
Ветвь выглядела вот так.

Это дерево несколько отличается от дерева в первом практикуме.
В дереве из первого практикума THIDA и POLAQ представляют собою одну ветвь, тогда как в дереве выше это иначе. Судя по полученному дереву PROMH ближе к (ECOLI,SERP5), нежели к THIDA.
HSLU
Это субъединица протеасомно-подобного деградационного комплекса.
Ветвь:

Абсолютно аналогичная ситуация как и с CLPX - PROMH ближе к (ECOLI,SERP5), нежели к THIDA, а в исходном дереве это не так.