Для получения протеомов моих бактерий и гомологичных белков из них я воспользовался следующими командами:
cp /P/y21/term4/Proteomes/'мнемоника'.fasta ~/public_html/term4/pr4
cat *.fasta >> proteomes.fasta
makeblastdb -dbtype prot -in proteomes.fasta
blastp -query P0A6H1.fasta -outfmt 7 -db proteomes.fasta -evalue 0.001 >> out.txt
В результате были получены файл proteomes.fasta со всеми протеомами и файл out.txt — список 23 находок гомологов белка CLPX_ECOLI.
Отредактированный файл с последовальностями находок и их id: findings.fasta.
Посредством программы FastME на платформе NGPhylogeny.fr была произведена реконструкция дерева найденных белков. Указанные параметры: "Gamma distributed rates across sites" — No (без моделирования скорости замен в различных сайтах); "Starting tree" — BIONJ (алгоритм построения дерева BIONJ); "No refinement" (без уточнения дерева); 100 бутстреп-реплик. Файл с Newick-формулой дерева: Output_Tree.nhx.
Рис.1. Реконструированное дерево с тремя ортологическими группами разных цветов. Дерево укоренено в среднюю точку; указаны числа бутстреп-поддержки.
Таблица пар белков-ортологов и паралогов:
Ортологи | Паралоги |
Q0S8C7 RHOJR и Q6NFB1 CORDI | Q0S6Y7 RHOJR и Q0S8C7 RHOJR |
Q6ACQ0 LEIXX и B0RHW4 CLAMS | A0LW31 ACIC1 и CLPX ACIC1 |
CLPX STRAW и CLPX ACIC1 | RUVB BIFLO и Q8G871 BIFLO |
Рис.2. Реконструированное дерево со "схлопнутыми" ортологическими группами разных цветов.
Характеристики групп: