muscle -in bacteria.fasta -out bacteria_aligned.fastaвыравнивания
UPGMA: fneighbor -datafile bacteria_tree.fdnadist -outfile bacteria.UPGMA.fneighbor -outtreefile bacteria.UPGMA.fneighbor.tree -treetype u
UPGMA method Negative branch lengths allowed +----------------------RALPJ ! --7 +---BURCA ! +--4 ! ! +---NEIMA +---------------6 ! +----PSEAE ! ! +-5 +ECOLI ! +-2 ! ! +SALTY +---3 ! +ENT38 +-1 +ERWCT
Дерево не совпадает с правильным. Возможно,потому что реконструкция деревьев по нуклеиновым кислотам дает обычно менее правильный результат, чем по белкам, т.к. одну аминокислоту могут кодировать разные триплеты, .
seqret sw:FTSH_ECOLICоздадим индексные файлы пакета BLAST:
formatdb -i proteo.fasta -p T -n indexПоищем гомологи программой BLASTP c порогом E-value, равным 0.0001:
blastall -p blastp -d index -i ftsh_ecoli.fasta -o gomologi.txt -e 0.0001Получили файл gomologi
Выберем из них те, которые принадлежат выбранным бактериям gom
Получим их последовательности: sew_bact.fasta
Выровняем их программой muscle.
muscle -in sew_bact.fasta -out bact_aligned.fastabact_aligned.fasta Подадим программе fprotpars.Получили 4 дерева bact_tree.fprotpars, рассмотрим первое:
+-----------------------------------------------Q9I5R4_PSE ! ! +--B2UIS9_RAL ! +-17 ! +----------------------16 +--B2UE66_RAL ! ! ! ! ! +-----Q1BNJ2_BUR ! ! ! ! +--B2UGP9_RAL +--6 +-------------15 +-14 ! ! ! ! +-------------13 +--Q1BXC9_BUR ! ! ! ! ! ! ! ! ! ! ! +-----A1IR46_NEI ! ! ! ! ! ! ! ! +-------12 +--------A4WEY9_ENT ! ! ! ! +--9 ! ! ! ! ! ! +-----FTSH_SALTY ! ! ! ! ! +-11 ! +--7 +--------8 ! +--FTSH_ECOLI ! ! ! +-10 ! ! ! +--Q6D9B8_ERW 1 ! ! ! ! +-----------Q9HV48_PSE ! ! ! ! +-----------HSLU_PSEAE ! ! ! ! ! ! +--HSLU_SALTY ! +--------------------------------2 +--5 ! ! +--4 +--HSLU_ECOLI ! ! ! ! ! +--3 +-----HSLU_ENT38 ! ! ! +--------HSLU_RALPJ ! +--------------------------------------------------B2U6W7_RALОртологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):
HSLU_SALTY и HSLU_ECOLI
FTSH_ECOLI и Q6D9B8_ERW
B2UGP9_RAL и Q1BXC9_BUR
Паралоги (два гомологичных белка из одного организма):B2UIS9_RAL и B2UE66_RAL