formatdb -i /home/export/samba/public/tmp/pm_genome.fasta -p F -n pm
создает индексные файлы (pm.nhr, pm.nin, pm.nsq) для поиска по геному
Pasteurella multocida.

formatdb -i /home/export/samba/public/tmp/st_genome.fasta -p F -n st
создает соответствующие индексные файлы для поиска по геному
Salmonella typhimurium
(возбудителя сальмонеллёза человека и мышиного тифа).

formatdb -i /home/export/samba/public/tmp/xc_genome.fasta -p F -n xc
создает соответствующие индексные файлы для поиска по геному
Xanthomonas campestris
(возбудителя чёрной гнили капусты).
Поиск гомологов PFLB_ECOLI: Геном Pasteurella multocida.
Число находок с Е-value<0,001: 2
xарактеристика лучшей находки: AE006043
Pasteurella multocida subsp. multocida str.Pm70
section 10 of 204 of the complete genome
Length = 10719
E-value находки: 0.0
AC соответствующей записи EMBL: AE006043
координаты выравнивания в записи EMBL: 1162-3483
координаты CDS в записи EMBL: 1156-3486
AC UniProt в записи EMBL: Q9CPG6
Поиск гомологов PFLB_ECOLI: Геномы Pasteurella multocida,
Salmonella typhimurium,
Xanthomonas campestris.
число находок с Е-value<0,001: 7
xарактеристика лучшей находки: AE008741
Salmonella typhimurium LT2
section 47 of 220 of the complete genome
Length = 25409
E-value находки: 0.0
AC соответствующей записи EMBL: AE008741
координаты выравнивания в записи EMBL: 19959-22238 (complement)
координаты CDS в записи EMBL: 19956-22238 (coplement)
AC UniProt в записи EMBL: Q7CQU1

команды genpath=/home/export/samba/public/tmp ,
3gen="$genpath/st_genome.fasta $genpath/xc_genome.fasta $genpath/pm_genome.fasta" и
formatdb -i "$3gen" -n 3gen -p F помогают создать индексные файлы сразу по трем геномам

blastall -p tblastn -d 3gen -i P09373.fasta -o flnalign.txt
проводит поиск по этим трем геномам и сохраняет результаты в файле flnalign.txt

результат лучшей находки:
>AE008741 AE006468 |AE008741| Salmonella typhimurium LT2, section 47 of
             220 of the complete genome.
          Length = 25409

 Score = 1423 bits (3683), Expect = 0.0
 Identities = 707/760 (93%), Positives = 725/760 (95%)
 Frame = -1

Query: 1     MSELNEKLATAWEGFTKGDWQNEVNVRDFIQKNYTPYEGDESFLAGATEATTTLWDKVME 60
             MSELNEKLATAWEGFTKGDWQNEVNVRDFIQKNYTPYEGDESFLAGAT+ATT LWD VME
Sbjct: 22238 MSELNEKLATAWEGFTKGDWQNEVNVRDFIQKNYTPYEGDESFLAGATDATTKLWDSVME 22059

Query: 61    GVKLENRTHAPVDFDTAVASTITSHDAGYINKQLEKIVGLQTEAPLKRALIPFGGIKMIE 120
             GVK ENRTHAPVDFDT+VASTITSHDAGYINK LEKIVGLQTEAPLKRA+IPFGGIKM+E
Sbjct: 22058 GVKQENRTHAPVDFDTSVASTITSHDAGYINKALEKIVGLQTEAPLKRAIIPFGGIKMVE 21879

Query: 121   GSCKAYNRELDPMIKKIFTEYRKTHNQGVFDVYTPDILRCRKSGVLTGLPDAXXXXXXXX 180
             GSCKAYNRELDPMIKKIFTEYRKTHNQGVFDVYTPDILRCRKSGVLTGLPDA        
Sbjct: 21878 GSCKAYNRELDPMIKKIFTEYRKTHNQGVFDVYTPDILRCRKSGVLTGLPDAYGRGRIIG 21699

Query: 181   XXXXVALYGIDYLMKDKLAQFTSLQADLENGVNLEQTIRLREEIAEQHRALGQMKEMAAK 240
                 VALYGIDYLMKDK AQFTSLQ+DLENGVNLE TIRLREEIAEQHRALGQ+KEMAAK
Sbjct: 21698 DYRRVALYGIDYLMKDKFAQFTSLQSDLENGVNLEATIRLREEIAEQHRALGQIKEMAAK 21519

Query: 241   YGYDISGPATNAQEAIQWTYFGYLAAVKSQNGAAMSFGRTSTFLDVYIERDLKAGKITEQ 300
             YG DISGPATNAQEAIQWTYFGYLAAVKSQNGAAMSFGR STFLD YIERDLKAGKITEQ
Sbjct: 21518 YGCDISGPATNAQEAIQWTYFGYLAAVKSQNGAAMSFGRVSTFLDAYIERDLKAGKITEQ 21339

Query: 301   EAQEMVDHLVMKLRMVRFLRTPEYDELFSGDPIWATESIGGMGLDGRTLVTKNSFRFLNT 360
             +AQEM+DHLVMKLRMVRFLRTPEYDELFSGDPIWATESIGGMG+DGRTLVTKNSFRFLNT
Sbjct: 21338 DAQEMIDHLVMKLRMVRFLRTPEYDELFSGDPIWATESIGGMGVDGRTLVTKNSFRFLNT 21159

Query: 361   LYTMGPSPEPNMTILWSEKLPLNFKKFAAKVSIDTSSLQYENDDLMRPDFNNDDYAIACC 420
             LYTMGPSPEPN+T+LWSEKLPLNFKKFAAKVSIDTSSLQYENDDLMRPDFNNDDYAIACC
Sbjct: 21158 LYTMGPSPEPNITVLWSEKLPLNFKKFAAKVSIDTSSLQYENDDLMRPDFNNDDYAIACC 20979

Query: 421   VSPMIVGKQMQFFGARANLAKTMLYAINGGVDEKLKMQVGPKSEPIKGDVLNYDEVMERM 480
             VSPMIVGKQMQFFGARANLAKTMLYAINGGVDEKLKMQVGPKSEPIKGDVLN+DEVM+RM
Sbjct: 20978 VSPMIVGKQMQFFGARANLAKTMLYAINGGVDEKLKMQVGPKSEPIKGDVLNFDEVMDRM 20799

Query: 481   DHFMDWLAKQYITALNIIHYMHDKYSYEASLMALHDRDVIRTMACGIAGLSVAADSLSAI 540
             DHFMDWLAKQY+TALN+IHYMHDKYSYEASLMALHDRDVIRTMACGIAGLSVAADSLSAI
Sbjct: 20798 DHFMDWLAKQYVTALNVIHYMHDKYSYEASLMALHDRDVIRTMACGIAGLSVAADSLSAI 20619

Query: 541   KYAKVKPIRDEDGLAIDFEIEGEYPQFGNNDPRVDDLAVDLVERFMKKIQKLHTYRDAIP 600
             KYAKVKPIRDEDGLAIDFEIEGEYPQFGNND RVDD+AVDLVERFMKKIQKL TYR AIP
Sbjct: 20618 KYAKVKPIRDEDGLAIDFEIEGEYPQFGNNDARVDDMAVDLVERFMKKIQKLTTYRGAIP 20439

Query: 601   TQSVLTITSNVVYGKKTGNTPDGRRXXXXXXXXXXXMHGRDQKGAVASLTSVAKLPFAYA 660
             TQSVLTITSNVVYGKKTGNTPDGRR           MHGRDQKGAVASLTSVAKLPFAYA
Sbjct: 20438 TQSVLTITSNVVYGKKTGNTPDGRRAGAPFGPGANPMHGRDQKGAVASLTSVAKLPFAYA 20259

Query: 661   KDGISYTFSIVPNALGKDDEVRKTNLAGLMDGYFHHEASIEGGQHLNVNVMNREMLLDAM 720
             KDGISYTFSIVPNALGKDDEVRKTNLAGLMDGYFHHEASIEGGQHLNVNVMNREMLLDAM
Sbjct: 20258 KDGISYTFSIVPNALGKDDEVRKTNLAGLMDGYFHHEASIEGGQHLNVNVMNREMLLDAM 20079

Query: 721   ENPEKYPQLTIRVSGYAVRFNSLTKEQQQDVITRTFTQSM 760
             E+PEKYPQLTIRVSGYAVRFNSLTKEQQQDVITRTFTQ+M
Sbjct: 20078 EHPEKYPQLTIRVSGYAVRFNSLTKEQQQDVITRTFTQTM 19959
Поиск гомологов L44140 : Геномы Pasteurella multocida,
Salmonella typhimurium,
Xanthomonas campestris.
Число находок с Е-value<0,001: 0
xарактеристика лучшей находки: AE012253
Xanthomonas campestris pv. campestris str. ATCC 33913, section 161 of 460 of the complete genome. Length = 25409
E-value находки: 0.71
AC соответствующей записи EMBL: AE012253
координаты выравнивания в записи EMBL: 5371-5721

3 семестр
на главную


© Sandra