Создадим файл с протеомами необходимых бактерий при помощи команды: cat /P/y17/term4/Proteomes/mnemonics.fasta >> for_blast.fasta, где mnemonics - это мнемоника необходимой бактерии. Далее при помощи программы blastp произведём поиск гомологов белка с мнемоникой CLPX_ECOLI (blastp -query CLPX_ECOLI.fasta -db for_blast.fasta -out homolog.fasta -evalue 0.001).
Список гомологичных белков доступен в файле. Скачаем белковые последовательности и выровним их при помощи muscle (muscle -in clpx_seq.fasta -out 403_align.fasta). Далее алгоритмом UPGMA построим дерево.