Практикум 3. Построение дерева, содержащего паралоги

Последовательность CLPX_ECOLI, для которой искали гомологов:


>sp|P0A6H1|CLPX_ECOLI ATP-dependent Clp protease ATP-binding subunit ClpX OS=Escherichia coli (strain K12) OX=83333 GN=clpX PE=1 SV=2
MTDKRKDGSGKLLYCSFCGKSQHEVRKLIAGPSVYICDECVDLCNDIIREEIKEVAPHRE
RSALPTPHEIRNHLDDYVIGQEQAKKVLAVAVYNHYKRLRNGDTSNGVELGKSNILLIGP
TGSGKTLLAETLARLLDVPFTMADATTLTEAGYVGEDVENIIQKLLQKCDYDVQKAQRGI
VYIDEIDKISRKSDNPSITRDVSGEGVQQALLKLIEGTVAAVPPQGGRKHPQQEFLQVDT
SKILFICGGAFAGLDKVISHRVETGSGIGFGATVKAKSDKASEGELLAQVEPEDLIKFGL
IPEFIGRLPVVATLNELSEEALIQILKEPKNALTKQYQALFNLEGVDLEFRDEALDAIAK
KAMARKTGARGLRSIVEAALLDTMYDLPSMEDVEKVVIDESVIDGQSKPLLIYGKPEAQQ
ASGE

Бактерии, в протеомах которых искали гомологов:

Название Мнемоника
Burkholderia cenocepacia BURCA
Neisseria meningitidis NEIMA
Roseobacter denitrificans ROSDO
Serratia proteamaculans SERP5
Shewanella denitrificans SHEDO
Thiobacillus denitrificans THIDA
Yersinia pestis YERPE

Команды, которые были использованы для запуска локального бласта:

makeblastdb -in proteomes.fasta -dbtype prot
blastp -query CLPX_ECOLI.txt -db proteomes.fasta -outfmt "6 sseqid evalue sseq" -evalue 0.0001 > blast_result.fasta
Из файла blast_result.fasta доставались id, по ним в файле со всеми протеомами искались последовательности (ведь дерево строить нужно по глобальному выравниванию, не по локальному, которое предоставляет бласт). После по выравниванию алгоритмом ClustalWS в программе JalView методом neighbour joining с использованием матрицы Blosum62 было построено дерево. На рисунке ниже разными цветами показаны паралоги, в серые рамки заключены ортологи, красными стрелочками отмечены события дупликации генов в некоторых из организмов.
Примечательно, что внутри групп ортологов CLPX и HSLU родственные отношения между белками разных видов совпадают. Поскольку эти белку очень схожи по функции (АТФ-связывающие домены протеаз), это ни о чем не говорит. Если бы они по функции отличались, можно было бы пытаться делать выводы об эволюционных отношениях видов.


Рисунок 1. Филогенетическое дерево белков-находок blast.