|
Построение и анализ дерева, содержащего паралоги
В выбранных мной бактериях (см. предыдущий практикум) требовалось найти гомологи белка CLPX_ECOLI. В таблице 1 приведены данные, полученные с помощью blastp (оставлено только по лучшему выравниванию от каждого белка):
blastp -query CLPX.fasta -db db.fasta -evalue 0.001 -out blast2.out -outfmt 7
query id | subject id | % identity | alignment length | mismatches | gap opens | q. start | q. end | s. start | s. end | evalue | bit score |
sp|P0A6H1|CLPX_ECOLI | sp|P0A6H1|CLPX_ECOLI | 100.00 | 424 | 0 | 0 | 1 | 424 | 1 | 424 | 0.0 | 860 |
sp|Q8ZRC0|CLPX_SALTY | 98.35 | 424 | 6 | 1 | 1 | 424 | 1 | 423 | 0.0 | 843 |
sp|A4W7A9|CLPX_ENT38 | 97.41 | 424 | 11 | 0 | 1 | 424 | 1 | 424 | 0.0 | 839 |
sp|Q9I2U0|CLPX_PSEAE | 77.03 | 418 | 94 | 2 | 1 | 417 | 1 | 417 | 0.0 | 654 |
sp|Q1BH84|CLPX_BURCA | 74.22 | 415 | 103 | 3 | 1 | 413 | 1 | 413 | 0.0 | 621 |
sp|Q8XYP6|CLPX_RALSO | 73.92 | 418 | 100 | 4 | 1 | 413 | 1 | 414 | 0.0 | 615 |
sp|Q3J1G7|CLPX_RHOS4 | 70.46 | 413 | 118 | 4 | 1 | 413 | 1 | 409 | 0.0 | 568 |
sp|Q9JTX8|CLPX_NEIMA | 69.21 | 406 | 117 | 2 | 15 | 413 | 8 | 412 | 0.0 | 557 |
sp|Q8Y3D8|HSLU_RALSO | 49.00 | 100 | 50 | 1 | 66 | 165 | 6 | 104 | 3e-22 | 98.2 |
sp|Q3J6B1|HSLU_RHOS4 | 47.52 | 101 | 52 | 1 | 66 | 166 | 5 | 104 | 2e-21 | 95.9 |
sp|Q9HUC5|HSLU_PSEAE | 36.69 | 169 | 86 | 4 | 66 | 234 | 4 | 151 | 2e-21 | 95.9 |
sp|P0A6H5|HSLU_ECOLI | 45.00 | 100 | 54 | 1 | 66 | 165 | 5 | 103 | 1e-20 | 93.6 |
sp|A4WG67|HSLU_ENT38 | 45.00 | 100 | 54 | 1 | 66 | 165 | 5 | 103 | 4e-20 | 92.0 |
sp|O30911|HSLU_SALTY | 45.00 | 100 | 54 | 1 | 66 | 165 | 5 | 103 | 4e-20 | 91.7 |
sp|Q1BSM8|HSLU_BURCA | 47.06 | 102 | 53 | 1 | 66 | 167 | 5 | 105 | 6e-17 | 82.4 |
sp|P0AAI3|FTSH_ECOLI | 34.62 | 78 | 45 | 2 | 115 | 192 | 188 | 259 | 2e-05 | 46.2 |
tr|A4WEY9|A4WEY9_ENT38 | 34.62 | 78 | 45 | 2 | 115 | 192 | 188 | 259 | 3e-05 | 46.2 |
sp|P63343|FTSH_SALTY | 34.62 | 78 | 45 | 2 | 115 | 192 | 188 | 259 | 3e-05 | 46.2 |
tr|A0A0H2XMS5|A0A0H2XMS5_BURCA | 36.36 | 77 | 43 | 2 | 115 | 191 | 186 | 256 | 1e-04 | 43.9 |
tr|Q3J045|Q3J045_RHOS4 | 31.88 | 138 | 74 | 6 | 59 | 191 | 138 | 260 | 2e-04 | 43.5 |
tr|Q8XZ78|Q8XZ78_RALSO | 35.06 | 77 | 44 | 3 | 115 | 191 | 190 | 260 | 2e-04 | 43.5 |
tr|Q9HV48|Q9HV48_PSEAE | 33.77 | 77 | 45 | 2 | 115 | 191 | 190 | 260 | 2e-04 | 43.5 |
sp|Q9JUB0|RUVB_NEIMA | 33.90 | 118 | 51 | 5 | 74 | 190 | 37 | 128 | 3e-04 | 42.7 |
tr|Q8XY02|Q8XY02_RALSO | 32.05 | 78 | 46 | 3 | 112 | 189 | 560 | 630 | 3e-04 | 42.7 |
sp|P57015|YIFB_SALTY | 24.64 | 138 | 62 | 3 | 78 | 193 | 193 | 310 | 4e-04 | 42.4 |
Таблица 1. Blastp
Ниже приведена ифформация о белках-гомологах (источник - blast.out):
- CLPX - ATP-dependent Clp protease ATP-binding subunit
- HSLU - ATP-dependent protease ATPase subunit HslU
- FTSH_ECOLI - ATP-dependent zinc metalloprotease FtsH
- A4WEY9_ENT38 - ATP-dependent zinc metalloprotease FtsH
- FTSH_SALTY - ATP-dependent zinc metalloprotease FtsH
- A0A0H2XMS5_BURCA - ATP-dependent zinc metalloprotease
- Q3J045_RHOS4 - ATP-dependent zinc metalloprotease FtsH
- Q8XZ78_RALSO - ATP-dependent zinc metalloprotease FtsH
- Q9HV48_PSEAE - ATP-dependent zinc metalloprotease FtsH
- RUVB_NEIMA - Holliday junction ATP-dependent DNA helicase
- Q8XY02_RALSO - Putative aaa atpase protein
- YIFB_SALTY - Uncharacterized protein YifB
С учетом явного отличия функций трех последних находок, я не включила их в дальнейший список выравниваемых последовательностей. Выравнивание производилось в Jalview с помощью Muscle. Полученный файл был открыт программой Mega. Построение дерева производилось методом maximum likehood (см. рис. 1). |
Рисунок 1.Дерево
|
По рисунку 1 видно, что белкок CLPX представлен своими ортологами у всех приведенных бактерий, белок HSLU - у всех, кроме одной. А друг относительно друга эти белки являются паралогами, то есть они прозошли в результате дупликации гена, причем обе копии в итоге присутствуют у всех бактерий, кроме NEIMA (Neisseria meningitidis).
Ортологами так же являются белки FTSH, присутствующие у E.coli и Salty (Salmonella typhimurium). Также можно заметить, что все белки на рис. 1 вроме CLPX и HSLU являются цинк-металлопротеазами, что позволяет предположить дупликацию в самом корне дерева, в результате которой образовался предок, во-первых, CLPX с HSLU, и во-вторых, всех остальных приведенных белков. В таком случае эти две группы будут паралогами.
| |