Необходимо было найти достоверные гомологи белка CLPX_ECOLI в протеомах организмов, с которыми велась работа в 1 практикуме.
Из директории /P/y19/term4/Proteomes перенёс к себе файлы с протеомами соответствующих бактерий, командой cat AGRFC.fasta BURCA.fasta RHIME.fasta SACD2.fasta BRUSU.fasta HAEIN.fasta ROSDO.fasta SHEDO.fasta >> data.fasta записывал в конец последнего файла протеомы. Командой makeblastdb -dbtype prot -in data.fasta -out bacteria сделал из получившегося файла датабазу, по которой будет происходить поиск blastp. Командой blastp -query query.fasta -db bacteria -out out.txt -evalue 0.001 провёл поиск программой blastp гомологов по протеомам выбранных бактерий. Список находок из выдачи BLAST находится в файле out.txt.
В файле data.fasta находятся последовательности всех последовательностей белков из выдачи. Они были выравнены muscle с параметрами по умолчанию. Полученное выравнивание было загружено в MEGA методом Analize. Филогенетическое дерево было получено UPGMA методом, посмотреть его в Newick-формате можно здесь. Визуализация дерева осуществлялась с помощью iTOL.
Для примера ортологов/паралогов: