Построение и анализ дерева, содержащего паралоги
Протеомы выбранных бактерий (список представлен в таблице ниже) перенесены в один файл -
all_bact.fasta
с помощью команды:
cat file1.fasta >> file2.fasta
Отобранные бактерии
Название
Мнемоника
Proteus mirabilis
PROMH
Saccharophagus degradans
SACD2
Acidiphilium cryptum
ACICJ
Paracoccus denitrificans
PARDP
Roseobacter denitrificans
ROSDO
Bartonella henselae
BARHE
Agrobacterium fabrum
AGRFC
Rhizobium meliloti
RHIME
Файл с протеомами преобразован в базу данных:
makeblastdb -in
all_bact.fasta
-dbtype prot
Файл с протеомами преобразован в базу данных:
blastp -db
all_bact.fasta
-query
P0A6H1.fasta
-out
term4pr3.txt
-evalue 0.001 -outfmt 7
Из всех найденных белков выбраны, имеющий процент идентичности больше 35, их список приведен в файле:
term4pr3.txt
Был создан фаста-файл, содержащий последовательности всех этих белков:
allhom.fasta
Последовательности этих белков были выровнены с помощью программы:
muscle -in
allhom.fasta
-out
allhommus1.fasta
Далее я использовала программу MEGA для построения и анализа дерева, содержащего паралоги
Примеры ортологов (произошло разделение путей эволюции белков в результате видообразования):
1. Белки с мнемоникой CLPX_*
2. Белки с мнемоникой HSLU_*
Примеры паралогов (произошла дупликация гена):
1. Белки CLPX_PROMH, HSLU_PROMH, B4F2B3_PROMH
2. Белки CLPX_AGRFC, HSLU_AGRFC, Q7CT50_AGRFC
© Grigorjeva Masha