Паралоги и визуализация

1. Поиск достоверных гомологов белка CLPX_ECOLI

С помощью программы blastp я провожу поиск гомологов белка CLPX_ECOLI (ATP-dependent Clp protease ATP-binding subunit ClpX) в моих 7 бактериях. Сначала создаю базу из протеома бактерии программой makeblastdb, затем запускаю белковый бласт, порог e-value 0,001. Далее приведен результат выдачи.

                                                                             
                                                                      Score     E
Sequences producing significant alignments:                          (Bits)  Value

  sp|Q820F8|CLPX_STRAW ATP-dependent Clp protease ATP-binding sub...  535     0.0   
  sp|Q0SGZ3|CLPX_RHOJR ATP-dependent Clp protease ATP-binding sub...  534     0.0   
  tr|Q1AVT0|Q1AVT0_RUBXD ATP-dependent Clp protease ATP-binding s...  524     0.0   
  tr|Q47MU4|Q47MU4_THEFY ATP-dependent Clp protease ATP-binding s...  516     0.0   
  sp|Q6AFZ6|CLPX_LEIXX ATP-dependent Clp protease ATP-binding sub...  509     1e-180
  sp|B0RAS4|CLPX_CLAMS ATP-dependent Clp protease ATP-binding sub...  491     2e-173
  sp|Q8G5R1|CLPX_BIFLO ATP-dependent Clp protease ATP-binding sub...  432     9e-150
  tr|Q1AU05|Q1AU05_RUBXD ATPase AAA-2 OS=Rubrobacter xylanophilus...  52.0    3e-07 
  tr|Q8G871|Q8G871_BIFLO Protease OS=Bifidobacterium longum (stra...  51.2    7e-07 
  tr|Q0S6Y7|Q0S6Y7_RHOJR Chaperone protein ClpB OS=Rhodococcus jo...  47.8    8e-06 
  tr|Q0S8C7|Q0S8C7_RHOJR ATP-binding subunit of ATP-dependent Clp...  47.0    1e-05 
  tr|Q47MZ2|Q47MZ2_THEFY ATPase OS=Thermobifida fusca (strain YX)...  43.9    1e-04 
  tr|Q1AY82|Q1AY82_RUBXD ATPase AAA-2 OS=Rubrobacter xylanophilus...  43.5    2e-04 
  sp|Q8G6B7|RUVB_BIFLO Holliday junction ATP-dependent DNA helica...  42.7    2e-04 
  tr|Q6ACQ0|Q6ACQ0_LEIXX ATP-dependent zinc metalloprotease FtsH ...  43.1    2e-04 
  tr|Q8G3S2|Q8G3S2_BIFLO ATP-dependent zinc metalloprotease FtsH ...  43.1    2e-04 
  tr|Q82QV8|Q82QV8_STRAW Putative AAA family ATPase OS=Streptomyc...  41.6    4e-04 
  tr|Q47KU4|Q47KU4_THEFY ATP-dependent zinc metalloprotease FtsH ...  42.0    5e-04 
  tr|Q82EE9|Q82EE9_STRAW ATP-dependent zinc metalloprotease FtsH ...  41.6    6e-04 
  tr|Q82EB8|Q82EB8_STRAW Putative ATP-dependent Clp protease OS=S...  41.6    7e-04 
  tr|B0RHW4|B0RHW4_CLAMS ATP-dependent zinc metalloprotease FtsH ...  41.2    8e-04 
  tr|Q0S8E3|Q0S8E3_RHOJR ATP-dependent zinc metalloprotease FtsH ...  41.2    0.001 

2. Реконструкция и визуализация

a) После выравнивания последовательностей гомологов реконструирую дерево методом наибольшего правдоподобия в программе MEGA.

Дерево в Newick-формате: ссылка

б) Ортологи и паралоги на дереве

На реконструированном дереве можно выделить следующие пары паралогов: CLPX_STRAW и Q82QV8_STRAW; RUVB_BIFLO и CLPX_BIFLO; CLPX_LEIXX и Q6ACQ0_LEIXX.
Пары ортологов: CLPX_RHOJR и Q47MU4_THEFY; Q6ACQ0_LEIXX и Q82EE9_STRAW; CLPX_BIFLO и Q1AVT0_RUBXD.

с) Изображения дерева.

fig1
Рис. 1. Ортологичные группы

На рисунке 1 представлено изображение дерева с цветовым обозначением двух самых крупных ортологичных групп (содержащих более 3 последовательностей). Зеленым цветом обозначены АТФ-связывающие субъединицы АТФ-зависимых Clp протеаз ClpX, голубым – АТФ-зависимые цинковые металлопротеазы FtsH.

fig2
Рис. 2. Изображение дерева со "схлопнутыми" ортологичными группами

Группа, отмеченная зеленым цветом (Clpx), содержит белки из всех 7 бактерий, реконструированная филогения белков совпадает с филогенией бактерий. Вторая группа (FtsH) не содержит белка из организма RUBXD, филогения этих белков также совпадает с филогенией бактерий.
Изображение эталонного дерева бактерий доступно по ссылке