Mnemonic | Superkingdom | Phylum | Class | Order | Family | Genus | Name |
---|---|---|---|---|---|---|---|
BRUSU | Bacteria | Proteobacteria | Alphaproteobacteria | Rhizobiales | Brucellaceae | Brucella | Brucella suis |
BARHE | Bacteria | Proteobacteria | Alphaproteobacteria | Rhizobiales | Bartonellaceae | Bartonella | Bartonella henselae |
RHIME | Bacteria | Proteobacteria | Alphaproteobacteria | Rhizobiales | Rhizobiaceae | Sinorhizobium | Rhizobium meliloti |
PARDP | Bacteria | Proteobacteria | Alphaproteobacteria | Rhodobacterales | Rhodobacteraceae | Paracoccus | Paracoccus denitrificans |
PASMU | Bacteria | Proteobacteria | Gammaproteobacteria | Pasteurellales | Pasteurellaceae | Pasteurella | Pasteurella multocida |
POLAQ | Bacteria | Proteobacteria | Betaproteobacteria | Burkholderiales | Burkholderiaceae | Polynucleobacter | Polynucleobacter asymbioticus |
THIDA | Bacteria | Proteobacteria | Betaproteobacteria | Nitrosomonadales | Thiobacillaceae | Thiobacillus | Thiobacillus denitrificans |
AROAE | Bacteria | Proteobacteria | Betaproteobacteria | Rhodocyclales | Rhodocyclaceae | Aromatoleum | Aromatoleum aromaticum |
Скобочная формула дерева ((((AROAE,THIDA),POLAQ),PASMU),(((BRUSU,BARHE),RHIME),PARDP));
Рисунок дерева
Ветви дерева Всего 5 нетривиальных ветвей:
Из директории /P/y17/Proteomes были взяты полные геномы бактерий, указанных в начале отчёта. Объединил файлы в один командой
cat *.fasta >> all.fa
Затем из полученного файла была создана база данных для локального поиска blast гомологов белка CLPX_ECOLI. Команды:
makeblastdb -in all.fa -dbtype prot blastp -query CLPX_ECOLI.fa -db all.fa -out result.out -evalue 0.001
Из файла res.out были взяты мнемоники белков, по которым в JalView с помощью Fetch Sequences были получены последовательности белков, которые были выровнены программой Muscle с параметрами по умолчанию. Полученное множественное выравнивание muscle_alignment.fa было открыт о в программе Mega 7 для построения филогенетического дерева программой Maximum likelihood.
Изображение дерева
Ссылка на файл со скобочной формулой.
Анализ дерева
Примерами групп ортологичных белков являются гены CLPX и HSLU (+ Q3SFW1). Поскольку они встречаются у большинства из выбранных бактерий и накопили различия в результате видообразования. Примером белков-паралогов являются гены A1BBJ2 PARDP и A1AZV8 PARDP. Это два гена одноо организма, кодирующие один и тот же белок (с некоторыми отличиями), которые возникли в результате дупликации гена предшественника в этом организме.