Ортологи и паралоги

Отобранные гомологи CLPX_ECOLI

Из директории на kodomo я отобрала 7 бактерий.

cat /P/y22/term4/Proteomes/ACICJ.fasta /P/y22/term4/Proteomes/BARHE.fasta /P/y22/term4/Proteomes/HAEIN.fasta /P/y22/term4/Proteomes/NEIMA.fasta /P/y22/term4/Proteomes/POLAQ.fasta /P/y22/term4/Proteomes/ROSDO.fasta /P/y22/term4/Proteomes/THIDA.fasta > pr5/pr_db.fasta

У этих бактерий я нашла белки, гомологичные белку CLPX_ECOLI

nano CLPX_ECOLI.fasta - создала файл с последовательностью исходного белка

makeblastdb -in pr_db.fasta -dbtype prot
blastp -task blastp -query CLPX_ECOLI.fasta -db pr_db.fasta -out blast.out -evalue 0.0001

В результате получилас список находок в blast.out

Рис. 1 Список находок гомологичных белков, blastp

В файл clpx_mid.list записала sw находок

Применила code.txt в командной строке и получила формулу дерева

Реконструкция и визуализация

Формула дерева в формате Newick : clpxm.tre

Последовательности в формате fasta : clpxm.fasta

В программе iTol я построила дерево и с помощью label_pr5.txt покрасила разные ортологические группы
Ортологи - гомологичные белки из разных организмов, разделившихся в результате видообразования.
Паралоги - гомологичные белки из одного организма.
В данном случае ортологи выделены цветами, а паралогами являются :

Рис. 2 Дерево белков, fastme MtREV

На следующей картинке ортологические группы схлопнуты - клады были названы по наиболее часто встречающемуся белку, т.е CLPX, HSLU и клада с разными белками.
Далее я проанализировала соответсвие филогении белков филогенетическому дереву бактерий

Рис. 3 Дерево белков, ортологические группы схлопнуты