Из директории на kodomo я отобрала 7 бактерий.
cat /P/y22/term4/Proteomes/ACICJ.fasta /P/y22/term4/Proteomes/BARHE.fasta /P/y22/term4/Proteomes/HAEIN.fasta /P/y22/term4/Proteomes/NEIMA.fasta /P/y22/term4/Proteomes/POLAQ.fasta /P/y22/term4/Proteomes/ROSDO.fasta /P/y22/term4/Proteomes/THIDA.fasta > pr5/pr_db.fasta
У этих бактерий я нашла белки, гомологичные белку CLPX_ECOLI
nano CLPX_ECOLI.fasta - создала файл с последовательностью исходного белка
makeblastdb -in pr_db.fasta -dbtype prot
blastp -task blastp -query CLPX_ECOLI.fasta -db pr_db.fasta -out blast.out -evalue 0.0001
В результате получилас список находок в blast.out
В файл clpx_mid.list записала sw находок
Применила code.txt в командной строке и получила формулу дерева
Формула дерева в формате Newick : clpxm.tre
Последовательности в формате fasta : clpxm.fasta
В программе iTol я построила дерево и с помощью label_pr5.txt покрасила разные ортологические группы
Ортологи - гомологичные белки из разных организмов, разделившихся в результате видообразования.
Паралоги - гомологичные белки из одного организма.
В данном случае ортологи выделены цветами, а паралогами являются :
На следующей картинке ортологические группы схлопнуты - клады были названы по наиболее часто встречающемуся белку, т.е
CLPX, HSLU и клада с разными белками.
Далее я проанализировала соответсвие филогении белков филогенетическому дереву бактерий