Я создал в своей рабочей директории индексные файлы пакета BLAST для поиска
по геному X.campestris.
Команда:(в bash)
formatdb -i xc_genome.fasta -p F -n xc
Файлы на выходе:
xc.nhr,xc.nih,xc.ncq
Используя программу TBLASTN пакета BLAST,провел соответствующий поиск участков с порогом на E-value 0,001.
Команда:
blastall -p tblastn -d xc -i pur3_ecoli.fasta -o out.txt -e 0.001
Файл на выходе:
out.txt
Результы поиска:
Число находок с Е-value<0,001 | 3 | |
Характеристика лучшей находки: | ||
E-value находки | 3e-42 | |
AC соответствующей записи EMBL | AE012391 | |
Координаты выравнивания(-ий) в записи EMBL | 10100-10702 | |
Координаты CDS в записи EMBL (если есть) | 10094-10747 | |
AC UniProt для этого CDS (если есть) | Q8P723 |
3.Провел поиск гомологов этого гена в трёх геномах программой
BLASTN.
Полученныe файлы:
out1.txt(E-value 0.001)
out2.txt(без огран-я)
В р-те:
Файл out1.txt содержит только одну находку.
Эта находка из ор-ма Salmonella typhimurium.
AC(EMBL):AE008812
В полученном файле имеются два выравнивания:
Score = 238 bits (120), Expect = 1e-62 Identities = 315/380 (82%) Strand = Plus / Plus Query: 238 cccgatgtggtcgtgctggctggttttatgcgcattctcagcccggcgtttgtctcccac 297 |||||||||||||||||||| ||||||||||| ||||| || ||| ||||||| | || Sbjct: 17336 cccgatgtggtcgtgctggccggttttatgcgtattctgagtccgatgtttgtcgcgcat 17395 Query: 298 tatgccgggcgtttgctgaacattcacccttctctgctgccgaaatatcccggattacac 357 || ||||||| ||||||||||||||||||| ||||| || |||||||| || || || Sbjct: 17396 tactacgggcgtctgctgaacattcacccttccctgctaccaaaatatccggggttgcat 17455 Query: 358 acccatcgtcaggcgctggaaaatggcgatgaagagcacggtacatcggtgcatttcgtc 417 |||||||| |||||||||||||| |||||||| ||||||||||| ||||| |||||||| Sbjct: 17456 acccatcgccaggcgctggaaaacggcgatgaggagcacggtacctcggtacatttcgtg 17515 Query: 418 accgatgaactggacggtggcccggttattttacaggcgaaagtcccggtatttgctggt 477 || || ||||| ||||| |||||||| ||| | |||||||| || ||||| ||||| Sbjct: 17516 acagacgaactcgacggcggcccggtcattctccaggcgaaggtgccggtttttgccaac 17575 Query: 478 gattcggaagatgacatcaccgcccgcgtgcaaacccaggaacacgccatttatccactg 537 || |||||||| |||||||| ||||| || || |||||||| || |||||||| ||| Sbjct: 17576 gacagcgaagatgatatcaccgcacgcgtacagactcaggaacatgcgatttatccgctg 17635 Query: 538 gtgattagctggtttgccgatggtcgtctgaaaatgcacgaaaacgccgcgtggctggat 597 ||||||||||||||||| | || ||||| || |||| ||| |||||||| |||||||| Sbjct: 17636 gtgattagctggtttgcgcaggggcgtctaaagatgcgcgataacgccgcctggctggac 17695 Query: 598 ggtcaacgtctgccgccgca 617 || | |||||||||||||| Sbjct: 17696 gggcgtcgtctgccgccgca 17715 и Score = 155 bits (78), Expect = 2e-37 Identities = 123/138 (89%) Strand = Plus / Plus Query: 1 atgaatattgtggtgcttatttccggcaacggaagtaatttacaggcaattattgacgcc 60 ||||||||||||||||| ||||||||||| ||||| ||||||||||| ||||| || ||| Sbjct: 17099 atgaatattgtggtgctgatttccggcaatggaagcaatttacaggcgattatcgatgcc 17158 Query: 61 tgtaaaaccaacaaaattaaaggcaccgtacgggcagttttcagcaataaggccgacgcg 120 || || | || ||||||||||||||| | ||||||| ||||||||||||||||||||| Sbjct: 17159 tgcgaagcgaagaaaattaaaggcaccctcagggcagtattcagcaataaggccgacgcg 17218 Query: 121 ttcggccttgaacgcgcc 138 |||||||||||||||||| Sbjct: 17219 ttcggccttgaacgcgcc 17236 Соответственно E-value лучшей находки 1e-62 Аннотация соответствующего фрагмента генома Salmonella typhimurium LT2 приведена здесь.Cравнение с предыдущим упражнением: