Практикум 4.

Паралоги, визуализация

Команды:
"/P/y18/term4/Proteomes/STRPN.fasta /P/y18/term4/Proteomes/LACLA.fasta /P/y18/term4/Proteomes/LACDA.fasta /P/y18/term4/Proteomes/STAA8.fasta /P/y18/term4/Proteomes/STAEQ.fasta /P/y18/term4/Proteomes/MOOTA.fasta > all_prot.fasta"
" makeblastdb -dbtype prot -in all_prot.fasta"
"blastp -evalue 0.001 -query ecoli_clpx.fasta -db all_prot.fasta -out blast.out"

Был составлен список белков, гомологичных белку CLPX_ECOLI. Скачать результат BLAST. Выдача BLAST:
                                                                      Score     E 
Sequences producing significant alignments:                          (Bits)  Value
sp|Q2RL30|CLPX_MOOTA ATP-dependent Clp protease ATP-binding sub...   533    0.0   
sp|Q5HNM9|CLPX_STAEQ ATP-dependent Clp protease ATP-binding sub...   499    3e-175	
sp|Q2FXQ7|CLPX_STAA8 ATP-dependent Clp protease ATP-binding sub...   498    8e-175
sp|Q9CGE6|CLPX_LACLA ATP-dependent Clp protease ATP-binding sub...   490    7e-172
sp|P63791|CLPX_STRPN ATP-dependent Clp protease ATP-binding sub...   486    3e-170
tr|Q1GAP8|Q1GAP8_LACDA ATP-dependent Clp protease ATP-binding s...   475    1e-165
sp|Q1G9V4|HSLU_LACDA ATP-dependent protease ATPase subunit HslU...   101    1e-23 
tr|Q2RJP5|Q2RJP5_MOOTA ATP-dependent protease ATPase subunit Hs...   100    3e-23 
sp|Q2FZ28|HSLU_STAA8 ATP-dependent protease ATPase subunit HslU...  98.2    1e-22 
sp|Q5HPT8|HSLU_STAEQ ATP-dependent protease ATPase subunit HslU...  93.6    6e-21 
sp|Q2FV74|CLPL_STAA8 ATP-dependent Clp protease ATP-binding sub...  57.8    3e-09 
tr|Q1GB74|Q1GB74_LACDA UVR domain-containing protein OS=Lactoba...  52.4    1e-07 
tr|M4YZ72|M4YZ72_STREQ Negative regulator of genetic competence...  52.0    2e-07 
tr|Q2RLR4|Q2RLR4_MOOTA AAA domain-containing protein OS=Moorell...  50.1    4e-07 
tr|A0A0H2USJ7|A0A0H2USJ7_STRPN ATP-dependent Clp protease, ATP-...  50.4    5e-07 
tr|Q2RLP6|Q2RLP6_MOOTA AAA domain-containing protein OS=Moorell...  48.5    1e-06 
tr|M4YWY5|M4YWY5_STREQ Sigma-54 factor interaction domain-conta...  47.8    3e-06 
tr|M4YVJ8|M4YVJ8_STREQ ATP-dependent zinc metalloprotease FtsH ...  47.8    4e-06 
tr|Q1GBN8|Q1GBN8_LACDA ATP-dependent zinc metalloprotease FtsH ...  46.6    9e-06 
sp|O69076|FTSH_STRPN ATP-dependent zinc metalloprotease FtsH OS...  46.2    1e-05 
tr|Q1G869|Q1G869_LACDA ATP-dependent Clp protease, ATP-binding ...  45.8    2e-05 
sp|Q2G2J8|Y1413_STAA8 Uncharacterized protein SAOUHSC_01413 OS=...  43.1    6e-05 
tr|Q2RM95|Q2RM95_MOOTA ATP-dependent zinc metalloprotease FtsH ...  43.1    1e-04 
sp|P46469|FTSH_LACLA ATP-dependent zinc metalloprotease FtsH OS...  42.7    1e-04 
sp|Q5HPD3|Y979_STAEQ Uncharacterized protein SERP0979 OS=Staphy...  41.6    2e-04 
tr|Q5HRP3|Q5HRP3_STAEQ ATP-dependent zinc metalloprotease FtsH ...  41.2    4e-04 
sp|Q9CI09|CLPE_LACLA ATP-dependent Clp protease ATP-binding sub...  40.8    5e-04 
tr|Q2RJJ8|Q2RJJ8_MOOTA AAA domain-containing protein OS=Moorell...  40.4    6e-04 
tr|Q2G0R0|Q2G0R0_STAA8 ATP-dependent zinc metalloprotease FtsH ...  40.0    0.001
Из этой таблицы были взяты идентификаторы белков, по которым в Jalview были получены последовательности для выравнивания. Далее в MEGAX с помощью Neighbor-Joining и бутстрэп анализа было построено дерево (Файл в nwk).
Bootstrap tree
Рис.1. Изображение дерева гомологов (бутстрэп)
Получилось, что ортологами являются, например: HSLU_LACDA и HSLU_STAEQ, CLPX_STAEQ и CLPX_MOOTA, FTSH_LACLA и Q1GBN8_LACDA; а паралогами: Q2RLP6_MOOTA и Q2RJJ8_MOOTA, Y1413_STAA8 и CLPL_STAA8, Q1G869_LACDA и Q1GB74_LACDA.
Построенная филогения белков соответсвует филогенетическому дереву бактерий, построенному в 1 практикуме.
tree
Рис.2. Изображение дерева, с ортологами, выделенными цветами.
tree
Рис.3. Изображение дерева со схлопнутыми группами ортологов.