Визуализация деревьев с паралогичными и ортологичными белками

Протеомы выбранных бактерий сложила в один файл, проиндексировала его, и затем запустила blastp.

Фрагмент выдачи blastp

     CLPX_MOOTA Q2RL30 ATP-dependent Clp protease ATP-binding subuni...   533    0.0   
     CLPX_CLOBH A5I6W0 ATP-dependent Clp protease ATP-binding subuni...   530    0.0   
     CLPX_BACSU P50866 ATP-dependent Clp protease ATP-binding subuni...   516    0.0   
     CLPX_LISMO Q8Y7K9 ATP-dependent Clp protease ATP-binding subuni...   511    1e-179
     CLPX_STAA8 Q2FXQ7 ATP-dependent Clp protease ATP-binding subuni...   498    1e-174
     CLPX_STRPN P63791 ATP-dependent Clp protease ATP-binding subuni...   486    4e-170
     Q5FKR6_LACAC Q5FKR6 ATP-dependent Clp protease ATP-binding subu...   484    3e-169
     CLPY_BACSU P39778 ATP-dependent protease ATPase subunit ClpY OS...   106    2e-25 
     HSLU_LACAC Q5FKD8 ATP-dependent protease ATPase subunit HslU OS...   101    1e-23 
     Q2RJP5_MOOTA Q2RJP5 ATP-dependent protease ATPase subunit HslU ...   100    4e-23 
     HSLU_LISMO Q8Y7J8 ATP-dependent protease ATPase subunit HslU OS...  99.8    5e-23 
     HSLU_STAA8 Q2FZ28 ATP-dependent protease ATPase subunit HslU OS...  98.2    2e-22 
     Q8Y8B1_LISMO Q8Y8B1 UVR domain-containing protein OS=Listeria m...  60.5    4e-10 
     CLPL_STAA8 Q2FV74 ATP-dependent Clp protease ATP-binding subuni...  57.8    3e-09 

Методом Maximum Likelyhood с бутстрепом построила дерево (.nwk) в программе MEGA.

Дерево
Рис. 1. Дерево ортологов и паралогов АТФ-зависимой протеазы некоторых фирмикут.

Три пары ортологов: CLPX_MOOTA & CLPX_CLOBH, HSLU_LACAC & CLPY_BACSU, CLPL_STAA8 & Q8Y8B1_LISMO;
три пары паралогов: CLPX_LISMO & HSLU_LISMO, CLPX_MOOTA & Q2RJP5_MOOTA, HSLU_STAA8 & CLPL_STAA8.
Белки с АС'шниками вместо мнемоник функции просто не аннотированы, но я проверила, что они действительно имеют отношение к этой протеазе.

Дерево
Рис. 2. "Схлопнутое" дерево ортологов АТФ-зависимой протеазы некоторых фирмикут.

В группе CLPX по белку из каждой бактерии; с деревом из 1 практикума совпадают только самые поздние дихотомии. Группа HSLU, CLPY представлена 5 видами; ветви, отделяющие MOOTA и LACAC, совпадают с исходным деревом. В группе CLPL, CLPE всего два вида.