muscle -in bacteria.fasta -out bacteria_aligned.fastaвыравнивания
UPGMA:
fneighbor -datafile bacteria_tree.fdnadist -outfile bacteria.UPGMA.fneighbor
-outtreefile bacteria.UPGMA.fneighbor.tree -treetype u
UPGMA method
Negative branch lengths allowed
+----------------------RALPJ
!
--7 +---BURCA
! +--4
! ! +---NEIMA
+---------------6
! +----PSEAE
! !
+-5 +ECOLI
! +-2
! ! +SALTY
+---3
! +ENT38
+-1
+ERWCT
Дерево не совпадает с правильным. Возможно,потому что реконструкция деревьев по нуклеиновым кислотам дает обычно менее правильный результат, чем по белкам, т.к. одну аминокислоту могут кодировать разные триплеты, .
seqret sw:FTSH_ECOLICоздадим индексные файлы пакета BLAST:
formatdb -i proteo.fasta -p T -n indexПоищем гомологи программой BLASTP c порогом E-value, равным 0.0001:
blastall -p blastp -d index -i ftsh_ecoli.fasta -o gomologi.txt -e 0.0001Получили файл gomologi
Выберем из них те, которые принадлежат выбранным бактериям gom
Получим их последовательности: sew_bact.fasta
Выровняем их программой muscle.
muscle -in sew_bact.fasta -out bact_aligned.fastabact_aligned.fasta Подадим программе fprotpars.Получили 4 дерева bact_tree.fprotpars, рассмотрим первое:
+-----------------------------------------------Q9I5R4_PSE
!
! +--B2UIS9_RAL
! +-17
! +----------------------16 +--B2UE66_RAL
! ! !
! ! +-----Q1BNJ2_BUR
! !
! ! +--B2UGP9_RAL
+--6 +-------------15 +-14
! ! ! ! +-------------13 +--Q1BXC9_BUR
! ! ! ! ! !
! ! ! ! ! +-----A1IR46_NEI
! ! ! ! !
! ! ! +-------12 +--------A4WEY9_ENT
! ! ! ! +--9
! ! ! ! ! ! +-----FTSH_SALTY
! ! ! ! ! +-11
! +--7 +--------8 ! +--FTSH_ECOLI
! ! ! +-10
! ! ! +--Q6D9B8_ERW
1 ! !
! ! +-----------Q9HV48_PSE
! !
! ! +-----------HSLU_PSEAE
! ! !
! ! ! +--HSLU_SALTY
! +--------------------------------2 +--5
! ! +--4 +--HSLU_ECOLI
! ! ! !
! +--3 +-----HSLU_ENT38
! !
! +--------HSLU_RALPJ
!
+--------------------------------------------------B2U6W7_RAL
Ортологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):
HSLU_SALTY и HSLU_ECOLI
FTSH_ECOLI и Q6D9B8_ERW
B2UGP9_RAL и Q1BXC9_BUR
Паралоги (два гомологичных белка из одного организма):B2UIS9_RAL и B2UE66_RAL