Я выбрал следующие 7 протеомов бактерий: ECOLI, BRUSU, POLAQ, RHIME, SHEDO, BURMA, ROSDO.
Далее объединил их в один файл, создал базу данных для локального BLAST и запустил поиск по гену CLPX_ECOLI.
Далее я объединил все последовательности находок в один файл. Осуществил множественное выравнивание с помощью MUSCLE, построил дерево с помощью FastME (модель MtRev) с бутстреп-поддержкой ветвей.
Как можно видеть на дереве, выделились 2 группы ортологов, соответственно CLPX - АТФ-связывающая субъединица АТФ-зависимой протеазы и HSLU - АТФазная субъединица АТФ-зависимой протеазы.
На этом изображении ортологические группы были схлопнуты. В группе ортологов CLPX филогения полностью соответствует рекомендуемой. В группе HSLU топология расположения ROSDO, RHIME, BRUSU соответствует данному нам дереву, также соответствует расположение ECOLI, SHEDO, BURMA. Единственное, последовательность HSLU_POLAQ не попала в список находок BLASTp с пороговым E-value, поэтому она не оказалась в дереве, и группа является неполной.
Итого можно видеть, что в данном наборе белков и с использованными алгоритмами выравнивания и построения дерева, филогения не сильно отличается от исходной.