Построение и анализ дерева, содержащего паралоги

В выбранных мной бактериях (см. предыдущий практикум) требовалось найти гомологи белка CLPX_ECOLI. В таблице 1 приведены данные, полученные с помощью blastp (оставлено только по лучшему выравниванию от каждого белка):

blastp -query CLPX.fasta -db db.fasta -evalue 0.001 -out blast2.out -outfmt 7

query idsubject id% identityalignment lengthmismatchesgap opensq. startq. ends. starts. endevaluebit score
sp|P0A6H1|CLPX_ECOLIsp|P0A6H1|CLPX_ECOLI100.004240014241424 0.0 860
sp|Q8ZRC0|CLPX_SALTY98.3542461142414230.0843
sp|A4W7A9|CLPX_ENT3897.41424110142414240.0839
sp|Q9I2U0|CLPX_PSEAE77.03418942141714170.0654
sp|Q1BH84|CLPX_BURCA74.224151033141314130.0621
sp|Q8XYP6|CLPX_RALSO73.924181004141314140.0615
sp|Q3J1G7|CLPX_RHOS470.464131184141314090.0568
sp|Q9JTX8|CLPX_NEIMA69.2140611721541384120.0557
sp|Q8Y3D8|HSLU_RALSO49.001005016616561043e-2298.2
sp|Q3J6B1|HSLU_RHOS447.521015216616651042e-2195.9
sp|Q9HUC5|HSLU_PSEAE36.691698646623441512e-2195.9
sp|P0A6H5|HSLU_ECOLI45.001005416616551031e-2093.6
sp|A4WG67|HSLU_ENT3845.001005416616551034e-2092.0
sp|O30911|HSLU_SALTY45.001005416616551034e-2091.7
sp|Q1BSM8|HSLU_BURCA47.061025316616751056e-1782.4
sp|P0AAI3|FTSH_ECOLI34.62784521151921882592e-0546.2
tr|A4WEY9|A4WEY9_ENT3834.62784521151921882593e-0546.2
sp|P63343|FTSH_SALTY34.62784521151921882593e-0546.2
tr|A0A0H2XMS5|A0A0H2XMS5_BURCA36.36774321151911862561e-0443.9
tr|Q3J045|Q3J045_RHOS431.88138746591911382602e-0443.5
tr|Q8XZ78|Q8XZ78_RALSO35.06774431151911902602e-0443.5
tr|Q9HV48|Q9HV48_PSEAE33.77774521151911902602e-0443.5
sp|Q9JUB0|RUVB_NEIMA33.9011851574190371283e-0442.7
tr|Q8XY02|Q8XY02_RALSO32.05784631121895606303e-0442.7
sp|P57015|YIFB_SALTY24.64138623781931933104e-0442.4

Таблица 1. Blastp

Ниже приведена ифформация о белках-гомологах (источник - blast.out):

  • CLPX - ATP-dependent Clp protease ATP-binding subunit
  • HSLU - ATP-dependent protease ATPase subunit HslU
  • FTSH_ECOLI - ATP-dependent zinc metalloprotease FtsH
  • A4WEY9_ENT38 - ATP-dependent zinc metalloprotease FtsH
  • FTSH_SALTY - ATP-dependent zinc metalloprotease FtsH
  • A0A0H2XMS5_BURCA - ATP-dependent zinc metalloprotease
  • Q3J045_RHOS4 - ATP-dependent zinc metalloprotease FtsH
  • Q8XZ78_RALSO - ATP-dependent zinc metalloprotease FtsH
  • Q9HV48_PSEAE - ATP-dependent zinc metalloprotease FtsH
  • RUVB_NEIMA - Holliday junction ATP-dependent DNA helicase
  • Q8XY02_RALSO - Putative aaa atpase protein
  • YIFB_SALTY - Uncharacterized protein YifB

С учетом явного отличия функций трех последних находок, я не включила их в дальнейший список выравниваемых последовательностей. Выравнивание производилось в Jalview с помощью Muscle. Полученный файл был открыт программой Mega. Построение дерева производилось методом maximum likehood (см. рис. 1).


Рисунок 1.Дерево

По рисунку 1 видно, что белкок CLPX представлен своими ортологами у всех приведенных бактерий, белок HSLU - у всех, кроме одной. А друг относительно друга эти белки являются паралогами, то есть они прозошли в результате дупликации гена, причем обе копии в итоге присутствуют у всех бактерий, кроме NEIMA (Neisseria meningitidis). Ортологами так же являются белки FTSH, присутствующие у E.coli и Salty (Salmonella typhimurium). Также можно заметить, что все белки на рис. 1 вроме CLPX и HSLU являются цинк-металлопротеазами, что позволяет предположить дупликацию в самом корне дерева, в результате которой образовался предок, во-первых, CLPX с HSLU, и во-вторых, всех остальных приведенных белков. В таком случае эти две группы будут паралогами.



НАЗАД ➜
© <Рюмина Екатерина>, 2018