Поиск и визуализация гомологов белка

Задача - найти гомологи белка CLPX_ECOLI в протеомах бактерий, которые были выбраны ранее. Для этого я скопировала протеомы в рабочую папку, объединила их в один файл, проиндексировала его и провела поиск программой blast.

cat * > all_proteoms.fasta

makeblastdb -in all_proteoms.fasta -dbtype prot

blastp -task blastp -query CLPX_ECOLI.fasta -db all_proteoms.fasta -out blastp_out.txt -outfmt 6 -evalue 0.001

Файл с выдачей

Из файлов с протеомами был получен файл с последовательностями белков.

При построении дерева использовались параметры:

Файл с деревом

Дерево было укоренено в среднюю точку.

Примеры ортологов: A1AZV8 PARDP - Q12Q18 SHEDO, HSLU SHEDO - HSLU ECOLI, CPLX PARDP - CPLX ROSDO

Примеры паралогов: A1AZV8 PARDP - HSLU PARDP, HSLU HAEIN - CPLX HAEIN, FTSH ECOLI - CPLX ECOLI

Дерево гомологичных белков
Дерево со схлопнутыми ортологическими группами

В группу CPLX вошли 7 белков, HSLU - 6, а в группу с белками с разными названиями - 5. Все деревья внутри них близки к филогении, но нигде не выделилась клада THIDA-HAEIN.