Были выбраны следующие виды: Aromatoleum aromaticum (AROAE), Brucella suis (BRUSU), Burkholderia mallei (BURMA), Escherichia coli (ECOLI), Pseudomonas aeruginosa (PSEAE), Pseudomonas mendocina (PSEMY), Thiobacillus denitrificans (THIDA), Yersinia pestis (YERPE).
Для поиска гомологов Clp protease Escherichia coli был использован код, принимающий на вход список мнемоник, последовательность протеазы E.coli.
Обнаруженные гомологи: выдача бласта.
Далее программо muscle было сделано выравнивание.
Для удобства приведу дерево видов (рис. 1), учитывая, что предложенное в задании дерево верное.
Далее было построено дерево (Newick) гомологов программой iqtree и бутстреп-поддержкой 1000 (рис. 2)
Были получены две основные ортологические группы (CLPX и HSLU), так, например, пары белков HSLU_PSEMY и HSLU_YERPE, HSLU_AROAE и Q3SFW1_THIDA
(>tr|Q3SFW1|Q3SFW1_THIDA ATP-dependent protease ATPase subunit HslU OS=Thiobacillus denitrificans (strain ATCC 25259) OX=292415 GN=hslU PE=3 SV=1), CLPX_BURMA и CLPX_ECOLI являются ортологами.
Паралогами являются, например, следующие пары белков HSLU_AROAE и CLPX_AROAE, CLPX_BURMA и HSLU_BURMA, CLPX_PSEMY и HSLU_PSEMY.
Всего рассматривается 16 белков по 8 в каждой ортологической группе. В ортологической группе CLPX тополгия почти совпала с топологией видов, за исключением того, что CLPX_AROAE оказался ближе к CLPX_BURMA, нежели к CLPX_THIDA.
В ортолгической группе белков HSLU белок HSLU_BRUSU на этой реконструкции оказался ближе к белкам HSLU BURMA, THIDA, AROAE, хотя согласно дереву видов BRUSU родственен всем остальным рассматриваемым видам.