Поиск гомологов PABB_ECOLI | Геном Pasteurella multocida | |
Число находок с Е-value<0,001 | 2 | |
Характеристика лучшей находки: | ||
E-value находки | 1e-39 | |
AC соответствующей записи EMBL | AE006094 | |
координаты выравнивания в записи EMBL | 2735...1647 | |
Координаты CDS в записи EMBL | complement(1614..3164) | |
AC UniProt в записи EMBL | Q9CN59 |
Score = 157 bits (397), Expect = 1e-39 Identities = 108/368 (29%), Positives = 187/368 (50%), Gaps = 24/368 (6%) Frame = -3 Query: 108 GLFGYDLGRRFESLPEIAEQDIVL--PDMAVGIYDWALIVDHQRHTVSLLSH-------- 157 GLF YDL +F + I Q+ L PD + + L +DHQ L S Sbjct: 2735 GLFAYDLVTQFIPMDNIQLQEDGLDCPDYCFYLAEHQLTLDHQLQQAQLHSFCFAPQYQT 2556 Query: 158 ------NDVNARRAWLESQQFSPQEDFTLTSDWQSNMTREQYGEKFRQVQEYLHSGDCYQ 211 + + + A +E D TLT+ N+ Q+ + + ++++L+ GD +Q Sbjct: 2555 ALQQQADQIIQKFANIEPHLHCVSADTTLTT----NLDDVQFKQIIQVLKQHLYQGDVFQ 2388 Query: 212 VNLAQRFHATYSGDEWQAFLQLNQANRAPFSAFLRLEQGAILSLSPERFILCDNS--EIQ 269 + ++RF + ++ QL N +P+ F++ E + SPE + +++ Sbjct: 2387 IVPSRRFSLACP-NTLASYRQLKHTNPSPYMFFMQDEDFTLFGASPESALKYTQQTRQLE 2211 Query: 270 TRPIKGTLPR------LPDPQEDSKQAVKLANSAKDRAENLMIVDLMRNDIGRVAVAGSV 323 PI G+ PR DP+ D++ ++L K+ AE+LM+VDL RNDI RV G+ Sbjct: 2210 IYPIAGSRPRGFYPNGQIDPELDARLELELRLDQKELAEHLMLVDLARNDIARVCETGTR 2031 Query: 324 KVPELFVVEPFPAVHHLVSTITAQLPEQLHASDLLRAAFPGGSITGAPKVRAMEIIDELE 383 +V +L V+ + + HLVS + +L +L A +A G++TGAPK++AM+++ ++E Sbjct: 2030 QVADLMQVDRYSHIMHLVSRVVGKLRPELDALHAYQACMNMGTLTGAPKIKAMQLLYQVE 1851 Query: 384 PQRRNAWCGSIGYLSFCGNMDTSITIRTLTAINGQIFCSAGGGIVADSQEEAEYQETFDK 443 Q+R+++ G++GYL+ G++DT I IR+ G + AG G V DS + E ET K Sbjct: 1850 QQKRHSYGGAVGYLASNGDLDTCIVIRSAFVQQGIAYIQAGCGEVLDSDPQKEADETRHK 1671 Query: 444 VNRILKQL 451 ++ + Sbjct: 1670 AQAVINAI 1647
dir=/home/export/samba/public/tmp genomes="$dir/pm_genome.fasta $dir/st_genome.fasta $dir/xc_genome.fasta" formatdb -i "$genomes" -n 3gen -p F blastall -p tblastn -e 10 -d 3gen -i HMP_ECOLI.fasta -o tblastn3gen.txt
Поиск гомологов PABB_ECOLI | Геном Pasteurella multocida | Геном Salmonella typhimurium | Геном Xanthomonas campestris | |
Число находок с Е-value<0,001 | 2 | 3 | 2 | |
Характеристика лучшей находки: | ||||
E-value находки | 6e-39 | 0.0 | 1e-59 | |
AC соответствующей записи EMBL | AE006094 | AE008781 | AE012143 | |
координаты выравнивания в записи EMBL | 2735...1671 | 7242...8597 | 8473...9855 | |
Координаты CDS в записи EMBL | complement(1614..3164) | 7239..8603 | 8428..9903 | |
AC UniProt в записи EMBL | Q9CN59 | P12680 | Q8PD81 |
Поиск сразу по трем геномам оказался продуктивнее, но лишь засчет того, что ранее не исследованном геноме нашелся более гомологичный исходному белку PABB белок. E-value предыдущей находки возрос, но незначительно(с 1е-39 до 6e-39). Размер базы данных повлиял на него незначительно. Поэтому, выгоднее и быстрее искать сразу по нескольким интересующим нас геномам.
>AE008781 AE006468 |AE008781| Salmonella typhimurium LT2, section 85 of 220 of the complete genome. Length = 21540 Score = 167 bits (84), Expect = 9e-41 Identities = 144/164 (87%) Strand = Plus / Plus Query: 1069 ctgctgcgcgcagcttttcctggtggctcaataaccggggctccgaaagtacgggctatg 1128 ||||||||||| ||||| || || ||||| || ||||| || || ||||| ||||| ||| Sbjct: 8310 ctgctgcgcgcggctttccccggcggctccattaccggcgcgcctaaagtgcgggcaatg 8369 Query: 1129 gaaattatcgacgaactggaaccgcagcgacgcaatgcctggtgcggcagcattggctat 1188 |||||||||||||||||||| |||||||||||||| ||||||||||| ||||| || ||| Sbjct: 8370 gaaattatcgacgaactggagccgcagcgacgcaacgcctggtgcggtagcatcggttat 8429 Query: 1189 ttgagcttttgcggcaacatggataccagtattactatccgcac 1232 |||| || |||||||| |||||||||||||||||||||||||| Sbjct: 8430 ctgagtttctgcggcaagatggataccagtattactatccgcac 8473 Score = 115 bits (58), Expect = 3e-25 Identities = 133/158 (84%) Strand = Plus / Plus Query: 874 aaactggcgaactcagcgaaagatcgtgccgaaaatctgatgattgtcgatttaatgcgt 933 |||||||| || ||| ||||||||| || |||||| |||||||||||||||| |||||| Sbjct: 8115 aaactggctaattcaatgaaagatcgcgctgaaaatttgatgattgtcgatttgatgcgt 8174 Query: 934 aatgatatcggtcgtgttgccgtagcaggttcggtaaaagtaccagagctgttcgtggtg 993 || ||||| || || || |||||| |||||||||| ||||| || || |||||||| || Sbjct: 8175 aacgatattggccgggtcgccgtaccaggttcggtgaaagtgccggaactgttcgtcgtc 8234 Query: 994 gaacccttccctgccgtgcatcatctggtcagcaccat 1031 ||||| || |||||||| || |||||||| |||||||| Sbjct: 8235 gaaccatttcctgccgttcaccatctggttagcaccat 8272 Score = 107 bits (54), Expect = 7e-23 Identities = 69/74 (93%) Strand = Plus / Plus Query: 1285 gccgatagccaggaagaagcggaatatcaggaaacttttgataaagttaatcgtatcctg 1344 ||||||||| | |||||||||||||||||||||||||||||||||||||||||||||||| Sbjct: 8526 gccgatagcaacgaagaagcggaatatcaggaaacttttgataaagttaatcgtatcctg 8585 Query: 1345 aagcaactggagaa 1358 | | ||||||||| Sbjct: 8586 cacccactggagaa 8599 Score = 65.9 bits (33), Expect = 2e-10 Identities = 51/57 (89%) Strand = Plus / Plus Query: 1 atgaagacgttatctcccgctgtgattactttactctggcgtcaggacgccgctgaa 57 |||||||||||||||||| |||| || || |||| |||||||| ||||||||||||| Sbjct: 7242 atgaagacgttatctcccactgttatcaccttaccctggcgtccggacgccgctgaa 7298 Score = 52.0 bits (26), Expect = 4e-06 Identities = 110/138 (79%) Strand = Plus / Plus Query: 549 ctggcaatccaatatgacccgcgagcagtacggcgaaaaatttcgccaggtacaggaata 608 |||||||||||||||||| || |||| ||||| || ||||| ||||| |||| | Sbjct: 7790 ctggcaatccaatatgacgcgttgcgagtatggcgagaagtttcgtcaggtgcaggcctg 7849 Query: 609 tctgcacagcggtgattgctatcaggtgaatctcgcccaacgttttcatgcgacctattc 668 ||||||||||| || ||||||||||| ||||| |||| |||||||| |||| ||| Sbjct: 7850 gctgcacagcggggactgctatcaggtcaatctttcccagcgttttcaggcgagctacga 7909 Query: 669 tggcgatgaatggcaggc 686 || |||||||||||||| Sbjct: 7910 gggtgatgaatggcaggc 7927Аннотация
ID AE008781; SV 1; linear; genomic DNA; STD; PRO; 21540 BP. XX AC AE008781; AE006468; XX DT 29-OCT-2001 (Rel. 69, Created) DT 12-AUG-2005 (Rel. 84, Last updated, Version 5) XX DE Salmonella typhimurium LT2, section 85 of 220 of the complete genome. XX KW . XX OS Salmonella typhimurium LT2 OC Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; OC Enterobacteriaceae; Salmonella FT source 1..21540 FT /organism="Salmonella typhimurium LT2" FT /strain="LT2; SGSC 1412; ATCC 700720" FT /mol_type="genomic DNA" FT /note="LT2" FT /db_xref="taxon:99287" . FT gene 7227..8603 FT /gene="pabB" FT /note="synonym: STM1824" FT RBS 7227..7232 FT /gene="pabB" FT /note="putative RBS for pabB; RegulonDB:STMS1H001997" FT CDS 7239..8603 FT /codon_start=1 FT /transl_table=11 FT /gene="pabB" FT /product="p-aminobenzoate synthetase, component I" FT /EC_number="4.1.3.-" FT /note="para-aminobenzoate synthase component I. FT (SW:PABB_SALTY)" FT /db_xref="GOA:P12680" FT /db_xref="InterPro:IPR005801" FT /db_xref="InterPro:IPR005802" FT /db_xref="InterPro:IPR006805" FT /db_xref="UniProtKB/Swiss-Prot:P12680" FT /protein_id="AAL20739.1" FT /translation="MMKTLSPTVITLPWRPDAAEHYFAPVNHLPWAMLLHSGDAIHPYN FT RFDILVADPVTTLTTRAQETTVCTARTTTVTLDDPLHVLQTQLEALPFHPQPDPDLPFQ FT GGALGLFGYDLGRRFEILPDTAARDIALPDMAIGLYDWALIVDHQKQVVSLISYHDADA FT RYRWLTSQRAPTRTPFRLTSAWQSNMTRCEYGEKFRQVQAWLHSGDCYQVNLSQRFQAS FT YEGDEWQAFERLNRANRAPFSAFLRLHDGAILSLSPERFIQLENGHIQTRPIKGTLPRL FT NDPQADRQQAQKLANSMKDRAENLMIVDLMRNDIGRVAVPGSVKVPELFVVEPFPAVHH FT LVSTITARLPDSLHATDLLRAAFPGGSITGAPKVRAMEIIDELEPQRRNAWCGSIGYLS FT FCGKMDTSITIRTVTATQGQLYCSAGGGIVADSNEEAEYQETFDKVNRILHPLEN"
Лучшая находка осталась прежней, но ее E-value возрос. Возможно, это можно объяснить тем, что по сравнению с белком, длина исследуемой нуклеотидной последовательности больше в три раза. Возможно, также вносит свое влияние вырожденность генетического кода - нуклеотиды будут разными, а аминокислоты одинаковыми. Однако, можно также заметить, что E-value других находок возрос. С учетом того, что процент идентичности с исходным белком очень маленький, можно сказать, что BLASTN избирателен и выбирает лишь достаточно близкие гомологи.