formatdb -i xc_genome.fasta -p F -n Xc
Эта командная строка
создает индексные файлы пакета BLAST для поиска по заданному геному.
blastall -p tblastn -d Xc -i ILVC_ECOLI.fasta -o result -e 0.001
Поиск гомологов ILVC_ECOLI | Геном бактерии Xanthomonas campestris | |
Число находок с Е-value<0,001 | 1 | |
Характеристика лучшей находки: | ||
E-value находки | 4e-32 | |
AC соответствующей записи EMBL | AE012450 | |
координаты выравнивания в записи EMBL | 375-1202, 882-1292 | |
Координаты CDS в записи EMBL | 351..1352 | |
AC UniProt в записи EMBL | Q8P5L5 | |
Геномы Salmonella typhimurium, Xanthomonas campestris, Pasteurella multocida | ||
E-value лучшей находки предыдущего поиска | 1e-31 | |
Число находок с Е-value<0,001 | 3 |
>AE008882 AE006468 |AE008882| Salmonella typhimurium LT2, section 186 of 220 of the complete genome. Length = 20107 Score = 1852 bits (934), Expect = 0.0 Identities = 1339/1474 (90%) Strand = Plus / Plus Query: 1 atggctaactacttcaatacactgaatctgcgccagcagctggcacagctgggcaaatgt 60 |||||||||||||| ||||||||||||||||||||||||||||| ||| |||| ||||| Sbjct: 11915 atggctaactactttaatacactgaatctgcgccagcagctggcgcagttgggtaaatgc 11974 Query: 61 cgctttatgggccgcgatgaattcgccgatggcgcgagctaccttcagggtaaaaaagta 120 ||||||||||||||||| ||||||||||| ||||||||||||||||||||||||||||| Sbjct: 11975 cgctttatgggccgcgacgaattcgccgacggcgcgagctaccttcagggtaaaaaagtg 12034 Query: 121 gtcatcgtcggctgtggcgcacagggtctgaaccagggcctgaacatgcgtgattctggt 180 |||||||||||||||||||| |||||||||||||||||||||||||||||||| || ||| Sbjct: 12035 gtcatcgtcggctgtggcgctcagggtctgaaccagggcctgaacatgcgtgactccggt 12094 Query: 181 ctcgatatctcctacgctctgcgtaaagaagcgattgccgagaagcgcgcgtcctggcgt 240 || ||||| |||||||| |||||||||||||| ||||| |||||||| || ||||||||| Sbjct: 12095 ctggatatttcctacgccctgcgtaaagaagccattgctgagaagcgtgcttcctggcgt 12154 Query: 241 aaagcgaccgaaaatggttttaaagtgggtacttacgaagaactgatcccacaggcggat 300 ||||||||||| || || || ||||| || || |||||||| |||||||| ||||| || Sbjct: 12155 aaagcgaccgagaacggcttcaaagtaggcacctacgaagagctgatcccgcaggctgac 12214 Query: 301 ctggtgattaacctgacgccggacaagcagcactctgatgtagtgcgcaccgtacagcca 360 ||||| ||||||||||||||||||| |||||||| || || ||||| |||||||||| Sbjct: 12215 ctggtagttaacctgacgccggacaaacagcactccgacgtggtgcgttccgtacagccg 12274 Query: 361 ctgatgaaagacggcgcggcgctgggctactcgcacggtttcaacatcgtcgaagtgggc 420 |||||||||||||||||||||||||||||||| ||||| ||||||||||| ||||||||| Sbjct: 12275 ctgatgaaagacggcgcggcgctgggctactcccacggcttcaacatcgtggaagtgggc 12334 Query: 421 gagcagatccgtaaagatatcaccgtagtgatggttgcgccgaaatgcccaggcaccgaa 480 ||||||||||||||||| |||||||| |||||||| |||||||| || || ||||||||| Sbjct: 12335 gagcagatccgtaaagacatcaccgtggtgatggtggcgccgaagtgtccgggcaccgaa 12394 Query: 481 gtgcgtgaagagtacaaacgtgggttcggcgtaccgacgctgattgccgttcacccggaa 540 || |||||||| ||||| ||||| ||||| || ||||||||||| ||||||||||||||| Sbjct: 12395 gtacgtgaagaatacaagcgtggcttcggtgtgccgacgctgatcgccgttcacccggaa 12454 Query: 541 aacgatccgaaaggcgaaggcatggcgattgccaaagcctgggcggctgcaaccggtggt 600 ||||||||| |||||||||||||||||||||| |||||||||||||| || ||||| ||| Sbjct: 12455 aacgatccgcaaggcgaaggcatggcgattgctaaagcctgggcggcggcgaccggcggt 12514 Query: 601 caccgtgcgggtgtgctggaatcgtccttcgttgcggaagtgaaatctgacctgatgggc 660 ||||||||||| || ||||| || || ||||| |||||||||||||| |||||||||||| Sbjct: 12515 caccgtgcgggcgtactggagtcttctttcgtggcggaagtgaaatccgacctgatgggc 12574 Query: 661 gagcaaaccatcctgtgcggtatgttgcaggctggctctctgctgtgcttcgacaagctg 720 ||||| |||||||||||||||||| ||||||| || ||||||||||| |||||||||||| Sbjct: 12575 gagcagaccatcctgtgcggtatgctgcaggccggttctctgctgtgtttcgacaagctg 12634 Query: 721 gtggaagaaggtaccgatccagcatacgcgaaaaaactgattcagttcggttgggaaacc 780 |||| |||||| ||||| || || || ||| ||||||||||||||||||| ||||||||| Sbjct: 12635 gtggcagaaggcaccgacccggcttatgcggaaaaactgattcagttcggctgggaaacc 12694 Query: 781 atcaccgaagcactgaaacagggcggcatcaccctgatgatggaccgtctctctaacccg 840 ||||||||||| ||||| |||||||||||||||||||||||||||||||| ||||||||| Sbjct: 12695 atcaccgaagcgctgaagcagggcggcatcaccctgatgatggaccgtctgtctaacccg 12754 Query: 841 gcgaaactgcgtgcttatgcgctttctgaacagctgaaagagatcatggcacccctgttc 900 ||||||||||||||||| ||||| || ||||||||||||||||||||||| || |||||| Sbjct: 12755 gcgaaactgcgtgcttacgcgctgtccgaacagctgaaagagatcatggcgccgctgttc 12814 Query: 901 cagaaacatatggacgacatcatctccggcgaattctcttccggtatgatggcggactgg 960 |||||||| ||||| ||||||||||||||||||||||||||||| |||||||| |||||| Sbjct: 12815 cagaaacacatggatgacatcatctccggcgaattctcttccggcatgatggctgactgg 12874 Query: 961 gccaacgatgataagaaactgctgacctggcgtgaagagaccggcaaaaccgcgtttgaa 1020 || ||||| ||||||||||||||||||||||||||||||||||||||||||||||| ||| Sbjct: 12875 gctaacgacgataagaaactgctgacctggcgtgaagagaccggcaaaaccgcgttcgaa 12934 Query: 1021 accgcgccgcagtatgaaggcaaaatcggcgagcaggagtacttcgataaaggcgtactg 1080 |||||||||||||||||||||||||||||||||||||||||||| ||||||||||| ||| Sbjct: 12935 accgcgccgcagtatgaaggcaaaatcggcgagcaggagtactttgataaaggcgtgctg 12994 Query: 1081 atgattgcgatggtgaaagcgggcgttgaactggcgttcgaaaccatggtcgattccggc 1140 ||||| ||||||||||||||||||||||| ||||||||||||| ||||| ||||||||| Sbjct: 12995 atgatcgcgatggtgaaagcgggcgttgagttggcgttcgaaactatggtggattccggc 13054 Query: 1141 atcattgaagagtctgcatattatgaatcactgcacgagctgccgctgattgccaacacc 1200 ||||| ||||| || || || || |||||||||||||||||||||||||| ||||||||| Sbjct: 13055 atcatcgaagaatccgcttactacgaatcactgcacgagctgccgctgatcgccaacacc 13114 Query: 1201 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgctgagtacggt 1260 |||||||||||||||||||||||||||||||||||||||||||||||||| || |||||| Sbjct: 13115 atcgcccgtaagcgtctgtacgaaatgaacgtggttatctctgataccgcagaatacggt 13174 Query: 1261 aactatctgttctcttacgcttgtgtgccgttgctgaaaccgtttatggcagagctgcaa 1320 ||||| ||||||||||||||||| || ||| ||||||||||||||||||| || ||||| Sbjct: 13175 aactacctgttctcttacgcttgcgtaccgctgctgaaaccgtttatggcggaattgcaa 13234 Query: 1321 ccgggcgacctgggtaaagctattccggaaggcgcggtagataacgggcaactgcgtgat 1380 |||||||| ||||||| ||||| ||||||||||||||||| |||| || || || || Sbjct: 13235 ccgggcgatctgggtagtgctatcccggaaggcgcggtagacaacgcacagcttcgcgac 13294 Query: 1381 gtgaacgaagcgattcgcagccatgcgattgagcaggtaggtaagaaactgcgcggctat 1440 |||||||| |||||||| || ||||||||||||||||||||||||||||||||||||||| Sbjct: 13295 gtgaacgacgcgattcgtagtcatgcgattgagcaggtaggtaagaaactgcgcggctat 13354 Query: 1441 atgacagatatgaaacgtattgctgttgcgggtt 1474 ||||| |||||||| |||||||| || ||||||| Sbjct: 13355 atgacggatatgaagcgtattgcggtagcgggtt 13388
Аннотация соответствующего фрагмента генома:
ID AE008882_49; parent: AE008882 AC AE008882; AE006468; FT CDS 11915..13390 FT /codon_start=1 FT /transl_table=11 FT /gene="ilvC" FT /product="ketol-acid reductoisomerase" FT /EC_number="1.1.1.86" FT /note="ketol-acid reductoisomerase. (SW:ILVC_SALTY)" FT /db_xref="GOA:P05989" FT /db_xref="InterPro:IPR000506" FT /db_xref="InterPro:IPR013023" FT /db_xref="InterPro:IPR013116" FT /db_xref="InterPro:IPR014359" FT /db_xref="UniProtKB/Swiss-Prot:P05989" FT /protein_id="AAL22759.1" FT /translation="MANYFNTLNLRQQLAQLGKCRFMGRDEFADGASYLQGKKVVIVGC FT GAQGLNQGLNMRDSGLDISYALRKEAIAEKRASWRKATENGFKVGTYEELIPQADLVVN FT LTPDKQHSDVVRSVQPLMKDGAALGYSHGFNIVEVGEQIRKDITVVMVAPKCPGTEVRE FT EYKRGFGVPTLIAVHPENDPQGEGMAIAKAWAAATGGHRAGVLESSFVAEVKSDLMGEQ FT TILCGMLQAGSLLCFDKLVAEGTDPAYAEKLIQFGWETITEALKQGGITLMMDRLSNPA FT KLRAYALSEQLKEIMAPLFQKHMDDIISGEFSSGMMADWANDDKKLLTWREETGKTAFE FT TAPQYEGKIGEQEYFDKGVLMIAMVKAGVELAFETMVDSGIIEESAYYESLHELPLIAN FT TIARKRLYEMNVVISDTAEYGNYLFSYACVPLLKPFMAELQPGDLGSAIPEGAVDNAQL FT RDVNDAIRSHAIEQVGKKLRGYMTDMKRIAVAG" SQ Sequence 1476 BP; ...
ИТОГО: В Salmonella typhimurium найден ген, гомологичный гену ilvC в E.coli
(процент Identities = 1339/1474 (90%) и аннотация это подтверждают)
В предыдущем упражнении эта находка также была лучшей.
© Поздышев Д.