Задание 1. Поиск в геноме L. monocytogenes участков, кодирующих белки, похожие на ENDOA_BACSU
Был найден всего лишь один участок, кодирующий гомологичный белок.
Число находок с E-value < 0,001 |
1 |
E-value лучшей находки |
9e-42
|
Название последовательности с лучшей находкой |
AL591977 Listeria monocytogenes strain EGD, complete genome, segment 5/12
|
Координаты лучшей находки (от-до) |
36511- 36855 |
Процент последовательности белка, вошедший в выравнивание с лучшей находкой |
100% |
Задание 2. Нахождение записи EMBL по последовательности программой BLASTN
Находка:
>EM_PRO:AB000519 AB000519.1 Streptomyces sp. DNA for sorbitol oxidase, complete cds.
Length = 1557
Score = 357 bits (180), Expect = 3e-96
Identities = 180/180 (100%)
Strand = Plus / Plus
Query: 1 ggcgtgggcaaccgctcattggcgggcgcggtgcgtgccctctccctggtgacggccgac 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 571 ggcgtgggcaaccgctcattggcgggcgcggtgcgtgccctctccctggtgacggccgac 630
Query: 61 ggggagacgcgcaccctgcggcgcaccgacgaggacttcgcgggcgcggtcgtctccctc 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 631 ggggagacgcgcaccctgcggcgcaccgacgaggacttcgcgggcgcggtcgtctccctc 690
Query: 121 ggcgccctcggcgtggtgacgtcgctggaactcgacctcgtgcccgccttcgaggtgcgc 180
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 691 ggcgccctcggcgtggtgacgtcgctggaactcgacctcgtgcccgccttcgaggtgcgc 750
а) В записи EMBL AB000519 присутствует эта последовательность;
б) координаты заданной последовательности в записи: 571-750 ; она соответсвует самой записи;
в) поле FT описан участок, включающий данную последовательность;
это ген SOX, и его направление (также как и у заданной последовательности, и у найденного участка) прямое.
FT source 1..1557
FT /organism="Streptomyces sp."
FT /strain="H-7775"
FT /mol_type="genomic DNA"
FT /db_xref="taxon:1931"
FT CDS 211..1473
FT /codon_start=1
FT /transl_table=11
FT /gene="SOX"
FT /product="sorbitol oxidase"
FT /function="sorbitol metabolism"
FT /db_xref="GOA:P97011"
FT /db_xref="InterPro:IPR006094"
FT /db_xref="InterPro:IPR007173"
FT /db_xref="InterPro:IPR016166"
FT /db_xref="InterPro:IPR016168"
FT /db_xref="UniProtKB/TrEMBL:P97011"
FT /protein_id="BAA19135.1"
FT /translation="MTPAEKNWAGNITFGAKRLCVPRSVRELRETVAASGAVRPLGTRH
FT SFNTVADTSGDHVSLAGLPRVVDIDVPGRAVSLSAGLRFGEFAAELHARGLALANLGSL
FT PHISVAGAVATGTHGSGVGNRSLAGAVRALSLVTADGETRTLRRTDEDFAGAVVSLGAL
FT GVVTSLELDLVPAFEVRQWVYEDLPEATLAARFDEVMSAAYSVSVFTDWRPGPVGQVWL
FT KQRVGDEGARSVMPAEWLGARLADGPRHPVPGMPAGNCTAQQGVPGPWHERLPHFRMEF
FT TPSNGDELQSEYFVARADAVAAYEALARLRDRIAPVLQVSELRTVAADDLWLSPAHGRD
FT SVAFHFTWVPDAAAVAPVAGAIEEALAPFGARPHWGKVFSTAPEVLRTLYPRYADFEEL
FT VGRHDPEGTFRNAFLDRYFRR"
Задание 3. Поиск гомологов гена белка ENDOA_BACSU (ydcE) программой BLASTN
Программа BLASTN обнаружила 3 "гомологичных" участка с наименьшим E-value 0,82, причем их длины 16, 16 и 22.
То есть ни о каком гене, гомологичном ydcE, не может идти и речи. В данном случае использование BLASTN не эффективно.
|