Страница курса биоинформатики
Факультет биоинженерии и биоинформатики
С помощью команды:
Поиск гомологов MODE_ECOLI | Геном Pasteurella multocida | |
Число находок с Е-value<0,001 | 1 | |
Характеристика лучшей находки: | AE006112 Pasteurella multocida subsp. multocida str. Pm70 section 79 of 204 of the complete genome. Length = 10166 Score = 179 bits (453), Expect = 2e-46 Identities = 109/265 (41%), Positives = 160/265 (60%), Gaps = 4/265 (1%) Frame = +1 | |
E-value находки | 2e-46 | |
AC соответствующей записи EMBL | AE006112 | |
координаты выравнивания в записи EMBL | 6040...6819 | |
Координаты CDS в записи EMBL | 6034..6825 | |
AC UniProt в записи EMBL | Q9CMR6 | |
По 3 геномам сразу: X. campestris, P. multocida, S. typhimurium | ||
Число находок с Е-value<0,001 | 2 | |
E-value находки AE006112 | 9e-46 |
>embl|AE006112|AE006112 Pasteurella multocida subsp. multocida str. Pm70 section 79 of 204 of the complete genome. Length = 10166 Score = 179 bits (453), Expect = 2e-46 Identities = 109/265 (41%), Positives = 160/265 (60%), Gaps = 4/265 (1%) Frame = +1 Query: 1 MQAEILLTLKLQQKLFADPRRISLLKHIALSGSISQGAKDAGISYKSAWDAINEMNQLSE 60 + +EILLT+KLQQ+LF DP+RI LLK I GSI+Q AK+A +SYKSAWD + MN++S Sbjct: 6040 LTSEILLTIKLQQQLFVDPKRIRLLKEIQKCGSINQAAKNAKVSYKSAWDHLAAMNEISP 6219 Query: 61 HILVERATXXXXXXXAVLTRYGQRLIQLYDLLAQIQQKAFDVLSDDDALPLNSLLAAISR 120 L+ER LT Y QRL+QLYDLL QQKAF +L D++ LPL+S+L A +R Sbjct: 6220 KPLLERNVGGKNGGGTELTVYAQRLLQLYDLLEHTQQKAFHILQDEN-LPLDSVLHATAR 6396 Query: 121 FSLQTSARNQWFGTITARXXXXXXXXXXXLLADGKTRLKVAITAQSGARLGLDEGKEVLI 180 FSLQ+SARNQ+FG I A + L V+IT +S RL L GKEV++ Sbjct: 6397 FSLQSSARNQFFGDIVALRHENIHCFVAIQIKGLAQPLTVSITEKSAQRLKLTLGKEVMM 6576 Query: 181 LLKAPWVGITQDEAVAQNADNQLPGIISHIERGAEQCEVLMAL----PDGQTLCATVPVN 236 ++KAPWV + +++ + + L + ++G + +L ++ + CAT +N Sbjct: 6577 MIKAPWVKVHREK--PEGVNTFLVNVKEITDKGDVEEVILTSINKHADEDMEFCAT--LN 6744 Query: 237 EATSLQQGQNVTAYFNADSVIIATL 261 +A +L+ + + + + VI+ATL Sbjct: 6745 KAENLKPDEQIWISIDPEQVILATL 6819
С помощью команды tblastn я искала гомологи белка mode_ecoli в геноме Pasteurella multocida.Из двух находок е-value < 0,001 только у одной: AE006112 (2e-46) - достаточно хорошее значени e-value (маленькое, а это значит что последовательности достаточно схожи). Найденный гомолог, исходя из аннотаций, очень близок исходному белку. Более того, гомолог уже предсказанный (Protein existence 4: Predicted). Вторая находка имеет плохое значение e-value - очень большое, 9,8. Это значит, что последовательности, выровненные с такими результатами, нельзя назвать достаточно схожими.
AE008732 AE006468 |AE008732| Salmonella typhimurium LT2, section 40 of 220 of the complete genome. Length = 22407 Score = 418 bits (1075), Expect = e-118 Identities = 218/262 (83%), Positives = 233/262 (88%) Frame = -3 Query: 1 MQAEILLTLKLQQKLFADPRRISLLKHIALSGSISQGAKDAGISYKSAWDAINEMNQLSE 60 MQAEILLTLKLQQKLFADPRRISLLKHIALSGSISQGAKDAGISYKSAWDAIN+MNQLSE Sbjct: 3547 MQAEILLTLKLQQKLFADPRRISLLKHIALSGSISQGAKDAGISYKSAWDAINDMNQLSE 3368 Query: 61 HILVERATXXXXXXXAVLTRYGQRLIQLYDLLAQIQQKAFDVLSDDDALPLNSLLAAISR 120 H+LVERAT AVLTRYGQRLIQLYDLL QIQQKAFDVLSDDDALPL+SLLAAISR Sbjct: 3367 HMLVERATGGKGGGGAVLTRYGQRLIQLYDLLGQIQQKAFDVLSDDDALPLDSLLAAISR 3188 Query: 121 FSLQTSARNQWFGTITARXXXXXXXXXXXLLADGKTRLKVAITAQSGARLGLDEGKEVLI 180 FSLQTSARNQWFGTITAR LLADGKTRLKVA+TAQSG RLGL+EGKEVLI Sbjct: 3187 FSLQTSARNQWFGTITARDRDLVQQHVDVLLADGKTRLKVALTAQSGERLGLEEGKEVLI 3008 Query: 181 LLKAPWVGITQDEAVAQNADNQLPGIISHIERGAEQCEVLMALPDGQTLCATVPVNEATS 240 LLKAPWVGIT+D AVA+ ADNQL G ISHIERGAEQCEVLMALPDGQTLCAT+P ++A + Sbjct: 3007 LLKAPWVGITRDAAVARAADNQLSGTISHIERGAEQCEVLMALPDGQTLCATIPTSDAAT 2828 Query: 241 LQQGQNVTAYFNADSVIIATLC 262 L++G +V A+FNAD VIIATLC Sbjct: 2827 LKEGDDVIAWFNADRVIIATLC 2762
E-value лучшей находки: 1e-97
Соответствующее выравнивание
AE008732 AE006468 |AE008732| Salmonella typhimurium LT2, section 40 of 220 of the complete genome. Length = 22407 Score = 355 bits (179), Expect = 1e-97 Identities = 566/695 (81%) Strand = Plus / Minus Query: 1 atgcaggccgaaatccttctcacccttaagctccaacaaaaattattcgccgacccgcgc 60 |||||||||||||||||||| ||||| || || || ||||| | || ||||| || || Sbjct: 3547 atgcaggccgaaatccttcttaccctgaaacttcagcaaaagctttttgccgatccccga 3488 Query: 61 cgcatttcgctactaaaacacattgcgctttccggttccattagccagggagcgaaagat 120 || || || || || |||||||||||||||||||| || ||||| ||||| |||||||| Sbjct: 3487 cgtatctctctgctgaaacacattgcgctttccggctcgattagtcagggcgcgaaagac 3428 Query: 121 gccggtattagctataaaagcgcctgggatgccattaacgagatgaatcagttaagtgag 180 || || || |||||||| |||||||||||||| || ||||| ||||| ||| | || || Sbjct: 3427 gcgggaatcagctataagagcgcctgggatgcgataaacgacatgaaccagcttagcgaa 3368 Query: 181 catattctggtcgagcgcgcaacaggcggtaaaggtggcggcggcgcagtactgacccgc 240 ||||| ||||| || |||||||| ||||| ||||| ||||||||||| ||| | |||||| Sbjct: 3367 catatgctggttgaacgcgcaacgggcggcaaaggcggcggcggcgcggtattaacccgc 3308 Query: 241 tatggtcagcgactgattcagctctatgacttactggcgcaaatccagcaaaaagccttt 300 ||||| ||||| ||||| ||||| || || || |||| ||||| ||||||||||| || Sbjct: 3307 tatggccagcgtctgatccagctttacgatttgctgggccaaattcagcaaaaagcgttc 3248 Query: 301 gatgtgttaagtgacgatgacgccctgccgctgaacagcctgctggccgcgatctcacgt 360 ||||||||||| |||||||||||||||||||| |||| ||||||||||| ||||| || Sbjct: 3247 gatgtgttaagcgacgatgacgccctgccgcttgacagtctgctggccgctatctcccgc 3188 Query: 361 ttttcactgcaaaccagcgcccgtaaccagtggttcggtaccatcaccgcccgcgatcat 420 ||||||||||||||||||||||| || ||||||||||| ||||| ||||||||||||| Sbjct: 3187 ttttcactgcaaaccagcgcccgaaatcagtggttcggcaccattaccgcccgcgatcgc 3128 Query: 421 gatgacgttcaacagcatgttgatgtcttactggctgacggaaaaacacgcctgaaagtc 480 ||| || ||||||||||| || || | ||||| ||||| ||||| || || |||||| Sbjct: 3127 gatctggtgcaacagcatgtcgacgtgctgctggccgacggcaaaacgcggctcaaagtc 3068 Query: 481 gcaattaccgcacaaagcggcgcgcgtctggggctggatgaaggcaaagaagtgttgata 540 || | || || |||||||||| |||||| || ||||| || || ||||||||| |||| Sbjct: 3067 gcgctgacggcgcaaagcggcgagcgtctcggcctggaggagggaaaagaagtgctgatc 3008 Query: 541 ttgctaaaagcgccgtgggtaggtattactcaggacgaggcggtcgcgcaaaacgctgac 600 ||||||||||||||||||| || ||||| | ||| | || || |||| ||||||| Sbjct: 3007 ctgctaaaagcgccgtgggttggcattacccgggatgcagccgttgcgcgcgccgctgac 2948 Query: 601 aaccaattaccgggtattattagtcatattgagcgcggcgcagagcagtgcgaagtatta 660 || || || |||| | || || ||||| ||||||||||| || ||||| ||||| || Sbjct: 2947 aatcagttgtcgggaacgatcagccatatcgagcgcggcgcggaacagtgtgaagtgttg 2888 Query: 661 atggcgctacccgacgggcaaacactgtgcgccac 695 |||||||| || ||||| || || ||||||||||| Sbjct: 2887 atggcgctgccggacggccagacgctgtgcgccac 2853
Аннотация соответствующего фрагмента генома
FT gene complement(793079..793867) FT /gene="modE" FT /locus_tag="b0761" FT /note="synonyms: chlD, modR, narD, ECK0750, JW0744" FT CDS complement(793079..793867) FT /codon_start=1 FT /transl_table=11 FT /gene="modE" FT /locus_tag="b0761" FT /product="DNA-binding transcriptional dual regulator" FT /function="regulator; Transport of small molecules: Anions" FT /note="molybdate uptake regulatory protein" FT /db_xref="GOA:P0A9G8" FT /db_xref="InterPro:IPR000847" FT /db_xref="InterPro:IPR003725" FT /db_xref="InterPro:IPR004606" FT /db_xref="InterPro:IPR005116" FT /db_xref="InterPro:IPR008995" FT /db_xref="InterPro:IPR011991" FT /db_xref="UniProtKB/Swiss-Prot:P0A9G8" FT /protein_id="AAC73848.1" FT /translation="MQAEILLTLKLQQKLFADPRRISLLKHIALSGSISQGAKDAGISY FT KSAWDAINEMNQLSEHILVERATGGKGGGGAVLTRYGQRLIQLYDLLAQIQQKAFDVLS FT DDDALPLNSLLAAISRFSLQTSARNQWFGTITARDHDDVQQHVDVLLADGKTRLKVAIT FT AQSGARLGLDEGKEVLILLKAPWVGITQDEAVAQNADNQLPGIISHIERGAEQCEVLMA FT LPDGQTLCATVPVNEATSLQQGQNVTAYFNADSVIIATLC"