С помощью программы blastp я провожу поиск гомологов белка CLPX_ECOLI (ATP-dependent Clp protease ATP-binding subunit ClpX) в моих 7 бактериях. Сначала создаю базу из протеома бактерии программой makeblastdb, затем запускаю белковый бласт, порог e-value 0,001. Далее приведен результат выдачи.
Score E Sequences producing significant alignments: (Bits) Value sp|Q820F8|CLPX_STRAW ATP-dependent Clp protease ATP-binding sub... 535 0.0 sp|Q0SGZ3|CLPX_RHOJR ATP-dependent Clp protease ATP-binding sub... 534 0.0 tr|Q1AVT0|Q1AVT0_RUBXD ATP-dependent Clp protease ATP-binding s... 524 0.0 tr|Q47MU4|Q47MU4_THEFY ATP-dependent Clp protease ATP-binding s... 516 0.0 sp|Q6AFZ6|CLPX_LEIXX ATP-dependent Clp protease ATP-binding sub... 509 1e-180 sp|B0RAS4|CLPX_CLAMS ATP-dependent Clp protease ATP-binding sub... 491 2e-173 sp|Q8G5R1|CLPX_BIFLO ATP-dependent Clp protease ATP-binding sub... 432 9e-150 tr|Q1AU05|Q1AU05_RUBXD ATPase AAA-2 OS=Rubrobacter xylanophilus... 52.0 3e-07 tr|Q8G871|Q8G871_BIFLO Protease OS=Bifidobacterium longum (stra... 51.2 7e-07 tr|Q0S6Y7|Q0S6Y7_RHOJR Chaperone protein ClpB OS=Rhodococcus jo... 47.8 8e-06 tr|Q0S8C7|Q0S8C7_RHOJR ATP-binding subunit of ATP-dependent Clp... 47.0 1e-05 tr|Q47MZ2|Q47MZ2_THEFY ATPase OS=Thermobifida fusca (strain YX)... 43.9 1e-04 tr|Q1AY82|Q1AY82_RUBXD ATPase AAA-2 OS=Rubrobacter xylanophilus... 43.5 2e-04 sp|Q8G6B7|RUVB_BIFLO Holliday junction ATP-dependent DNA helica... 42.7 2e-04 tr|Q6ACQ0|Q6ACQ0_LEIXX ATP-dependent zinc metalloprotease FtsH ... 43.1 2e-04 tr|Q8G3S2|Q8G3S2_BIFLO ATP-dependent zinc metalloprotease FtsH ... 43.1 2e-04 tr|Q82QV8|Q82QV8_STRAW Putative AAA family ATPase OS=Streptomyc... 41.6 4e-04 tr|Q47KU4|Q47KU4_THEFY ATP-dependent zinc metalloprotease FtsH ... 42.0 5e-04 tr|Q82EE9|Q82EE9_STRAW ATP-dependent zinc metalloprotease FtsH ... 41.6 6e-04 tr|Q82EB8|Q82EB8_STRAW Putative ATP-dependent Clp protease OS=S... 41.6 7e-04 tr|B0RHW4|B0RHW4_CLAMS ATP-dependent zinc metalloprotease FtsH ... 41.2 8e-04 tr|Q0S8E3|Q0S8E3_RHOJR ATP-dependent zinc metalloprotease FtsH ... 41.2 0.001
a) После выравнивания последовательностей гомологов реконструирую дерево методом наибольшего правдоподобия в программе MEGA.
Дерево в Newick-формате: ссылка
б) Ортологи и паралоги на дереве
На реконструированном дереве можно выделить следующие пары паралогов: CLPX_STRAW и Q82QV8_STRAW; RUVB_BIFLO и CLPX_BIFLO; CLPX_LEIXX и Q6ACQ0_LEIXX.
Пары ортологов: CLPX_RHOJR и Q47MU4_THEFY; Q6ACQ0_LEIXX и Q82EE9_STRAW; CLPX_BIFLO и Q1AVT0_RUBXD.
с) Изображения дерева.
На рисунке 1 представлено изображение дерева с цветовым обозначением двух самых крупных ортологичных групп (содержащих более 3 последовательностей). Зеленым цветом обозначены АТФ-связывающие субъединицы АТФ-зависимых Clp протеаз ClpX, голубым – АТФ-зависимые цинковые металлопротеазы FtsH.
Группа, отмеченная зеленым цветом (Clpx), содержит белки из всех 7 бактерий, реконструированная филогения белков совпадает с филогенией бактерий. Вторая группа (FtsH) не содержит белка из организма RUBXD, филогения этих белков также совпадает с филогенией бактерий.
Изображение эталонного дерева бактерий доступно по ссылке