Практикум 4. Паралоги, визуализация.

Таблица 1. Выбранные бактерии
НазваниеМнемоника
Acidothermus cellulolyticusACIC1
Arthrobacter sp.ARTS2
Bifidobacterium longumBIFLO
Clavibacter michiganensisCLAMS
Leifsonia xyliLEIXX
Nocardioides sp.NOCSJ
Streptomyces avermitilisSTRAW
Thermobifida fuscaTHEFY

1. Составление списка гомологичных белков, включающих паралоги

Для начала работы я объединил протеомы бактерий из практикума 1 в файл proteomes.fasta. Далее с помощью blastp был проведен поиск гомологов белка CLPX_ECOLI - команды:

makeblastdb -dbtype prot -in proteomes.fasta -out bacdb

blastp -query CLPX_ECOLI.fasta -db bacdb -evalue 0.001 -out res.txt

В итоге получен список находок. Из него перед построением выравнивания в MEGA7. Дерево(Newick) также было построено в программе MEGA7 методом Neighbor-Joining.

Ортологи:

CLPX_ACIC1 и CLPX_ARTS2; FTSH_ACIC1 и Q6ACQ0_LEIXX; A0K236_ARTS2 и A0LW31_ACIC1.

Паралоги:

Q47MZ2_THEFY и Q47MU4_THEFY; CLPX_BIFLO и Q8G3S2_BIFLO; Q82EE9_STRAW и Q82EB8_STRAW

Дерево, ветви которого схлопнуты, было импортировано в MEGA11 из MEGA7, собственно, для схлопывания ветвей.

На деревьях сверху красным отмечена группа белков-ортологов CLPX - АТФ-связывающих субъединиц АТФ-зависимой протеазы Clp. С деревом из 1 практикума есть совпадающие поддеревья: (LEIXX,CLAMS); (THEFY,STRAW). В остальном топология деревьев отличается.

Зеленым отмечена группа цинк-зависимой металлопротеазы FtsH. С деревом из 1 практикума совпадает поддерево ((LEIXX, CLAMS), ARTS2). В остальном деревья отличаются.