Составление списка гомологичных белков, включающих паралоги
Необходимо найти в бактериях из первого(второго) практикума достоверные гомологи белка CLPX_ECOLI.
Воспользуемся командой:
blastp -query P0A6H1.fasta -db all.fasta -out blast666.txt -evalue 0.001
На выход был получен
Файл
Список находок из выдачи BLAST (без заголовка выдачи и выравниваний):
Sequences producing significant alignments: (Bits) Value
sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding sub... 860 0.0
sp|A8GAR0|CLPX_SERP5 ATP-dependent Clp protease ATP-binding sub... 806 0.0
sp|B4EU54|CLPX_PROMH ATP-dependent Clp protease ATP-binding sub... 769 0.0
sp|Q3SI99|CLPX_THIDA ATP-dependent Clp protease ATP-binding sub... 642 0.0
sp|A4SXD7|CLPX_POLAQ ATP-dependent Clp protease ATP-binding sub... 613 0.0
sp|Q6G3Z2|CLPX_BARHE ATP-dependent Clp protease ATP-binding sub... 588 0.0
sp|Q165G0|CLPX_ROSDO ATP-dependent Clp protease ATP-binding sub... 582 0.0
sp|Q6G5G0|HSLU_BARHE ATP-dependent protease ATPase subunit HslU... 97.1 4e-22
sp|A8GL96|HSLU_SERP5 ATP-dependent protease ATPase subunit HslU... 96.7 7e-22
sp|B4F171|HSLU_PROMH ATP-dependent protease ATPase subunit HslU... 96.7 7e-22
sp|P0A6H5|HSLU_ECOLI ATP-dependent protease ATPase subunit HslU... 93.6 6e-21
sp|Q16CY2|HSLU_ROSDO ATP-dependent protease ATPase subunit HslU... 93.6 7e-21
tr|Q3SFW1|Q3SFW1_THIDA ATP-dependent protease ATPase subunit Hs... 86.7 2e-18
tr|A8GCD8|A8GCD8_SERP5 ATP-dependent Clp protease, ATP-binding ... 51.6 4e-07
tr|B4EV83|B4EV83_PROMH ATP-dependent Clp protease ATP-binding s... 50.1 1e-06
tr|B4F2B3|B4F2B3_PROMH ATP-dependent zinc metalloprotease FtsH ... 46.6 1e-05
sp|P0AAI3|FTSH_ECOLI ATP-dependent zinc metalloprotease FtsH OS... 46.2 2e-05
tr|A8G901|A8G901_SERP5 ATP-dependent zinc metalloprotease FtsH ... 46.2 2e-05
sp|Q168A2|RUVB_ROSDO Holliday junction ATP-dependent DNA helica... 45.4 2e-05
tr|A0A0H3LXZ4|A0A0H3LXZ4_BARHE ATP-dependent zinc metalloprotea... 45.4 3e-05
sp|Q6G5R1|RUVB_BARHE Holliday junction ATP-dependent DNA helica... 43.5 9e-05
tr|Q3SJR4|Q3SJR4_THIDA ATP-dependent zinc metalloprotease FtsH ... 43.5 1e-04
tr|A4SXL5|A4SXL5_POLAQ ATP-dependent zinc metalloprotease FtsH ... 43.5 1e-04
sp|P0ABH9|CLPA_ECOLI ATP-dependent Clp protease ATP-binding sub... 43.1 2e-04
tr|Q3SJH1|Q3SJH1_THIDA ATP-dependent Clp protease, ATP-binding ... 42.7 2e-04
tr|Q16C81|Q16C81_ROSDO Chaperone protein ClpB OS=Roseobacter de... 41.2 6e-04
tr|Q167Z2|Q167Z2_ROSDO ATP-dependent zinc metalloprotease FtsH ... 41.2 6e-04
tr|Q3SKL1|Q3SKL1_THIDA Chaperone protein ClpB OS=Thiobacillus d... 40.8 0.001
Реконструкция и визуализация
Последовательности всех белков я выровнял в Muscle,и загрузил в MEGA-X.
Построил с помощью Neighbour Joining дерево. В Newick-формате
ссылка.
Полученное дерево:
![](https://kodomo.fbb.msu.ru/~dimabosov/term4/pr4/Proteomes/123456.jpg)
Паралоги:
CLPX_BARHE и RUVB_BARHE
A4SXL5_POLAQ и CLPX_POLAQ
CLPX_ECOLI и FTSH_ECOLI
Ортологи:
CLPX_ECOLI и CLPX_SERP5
CLPX_THIDA и CLPX_BARHE
HSLU_SERP5 и HSLU_PROMH
Древо со схлопнутыми ортологичными группами:
![](https://kodomo.fbb.msu.ru/~dimabosov/term4/pr4/Proteomes/1234.jpg)
Описание групп:
CLPX
Это субъединица АТФ-зависимой протеазы.
Ветвь выглядела вот так.
![](https://kodomo.fbb.msu.ru/~dimabosov/term4/pr4/Proteomes/111.jpg)
Это дерево несколько отличается от дерева в
первом практикуме.
В дереве из первого практикума THIDA и POLAQ представляют собою одну ветвь, тогда как в дереве выше это иначе.
Судя по полученному дереву PROMH ближе к (ECOLI,SERP5), нежели к THIDA.
HSLU
Это субъединица протеасомно-подобного деградационного комплекса.
Ветвь:
![](https://kodomo.fbb.msu.ru/~dimabosov/term4/pr4/Proteomes/15.jpg)
Абсолютно аналогичная ситуация как и с CLPX - PROMH ближе к (ECOLI,SERP5), нежели к THIDA, а в исходном дереве это не так.