Занятие 6. "Программы пакета BLAST для работы с нуклеотидными последовательностями"



Задание 1. Поиск в геноме L. monocytogenes участков, кодирующих белки, похожие на ENDOA_BACSU

Был найден всего лишь один участок, кодирующий гомологичный белок.
Число находок с E-value < 0,001 1
E-value лучшей находки 9e-42
Название последовательности с лучшей находкой AL591977 Listeria monocytogenes strain EGD, complete genome, segment 5/12
Координаты лучшей находки (от-до) 36511- 36855
Процент последовательности белка, вошедший в выравнивание с лучшей находкой 100%

Задание 2. Нахождение записи EMBL по последовательности программой BLASTN

Находка:

>EM_PRO:AB000519 AB000519.1 Streptomyces sp. DNA for sorbitol oxidase, complete cds.
          Length = 1557

 Score =  357 bits (180), Expect = 3e-96
 Identities = 180/180 (100%)
 Strand = Plus / Plus

                                                                       
Query: 1   ggcgtgggcaaccgctcattggcgggcgcggtgcgtgccctctccctggtgacggccgac 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 571 ggcgtgggcaaccgctcattggcgggcgcggtgcgtgccctctccctggtgacggccgac 630

                                                                       
Query: 61  ggggagacgcgcaccctgcggcgcaccgacgaggacttcgcgggcgcggtcgtctccctc 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 631 ggggagacgcgcaccctgcggcgcaccgacgaggacttcgcgggcgcggtcgtctccctc 690

                                                                       
Query: 121 ggcgccctcggcgtggtgacgtcgctggaactcgacctcgtgcccgccttcgaggtgcgc 180
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 691 ggcgccctcggcgtggtgacgtcgctggaactcgacctcgtgcccgccttcgaggtgcgc 750

а) В записи EMBL AB000519 присутствует эта последовательность;
б) координаты заданной последовательности в записи: 571-750 ; она соответсвует самой записи;
в) поле FT описан участок, включающий данную последовательность; это ген SOX, и его направление (также как и у заданной последовательности, и у найденного участка) прямое.

FT   source          1..1557
FT                   /organism="Streptomyces sp."
FT                   /strain="H-7775"
FT                   /mol_type="genomic DNA"
FT                   /db_xref="taxon:1931"
FT   CDS             211..1473
FT                   /codon_start=1
FT                   /transl_table=11
FT                   /gene="SOX"
FT                   /product="sorbitol oxidase"
FT                   /function="sorbitol metabolism"
FT                   /db_xref="GOA:P97011"
FT                   /db_xref="InterPro:IPR006094"
FT                   /db_xref="InterPro:IPR007173"
FT                   /db_xref="InterPro:IPR016166"
FT                   /db_xref="InterPro:IPR016168"
FT                   /db_xref="UniProtKB/TrEMBL:P97011"
FT                   /protein_id="BAA19135.1"
FT                   /translation="MTPAEKNWAGNITFGAKRLCVPRSVRELRETVAASGAVRPLGTRH
FT                   SFNTVADTSGDHVSLAGLPRVVDIDVPGRAVSLSAGLRFGEFAAELHARGLALANLGSL
FT                   PHISVAGAVATGTHGSGVGNRSLAGAVRALSLVTADGETRTLRRTDEDFAGAVVSLGAL
FT                   GVVTSLELDLVPAFEVRQWVYEDLPEATLAARFDEVMSAAYSVSVFTDWRPGPVGQVWL
FT                   KQRVGDEGARSVMPAEWLGARLADGPRHPVPGMPAGNCTAQQGVPGPWHERLPHFRMEF
FT                   TPSNGDELQSEYFVARADAVAAYEALARLRDRIAPVLQVSELRTVAADDLWLSPAHGRD
FT                   SVAFHFTWVPDAAAVAPVAGAIEEALAPFGARPHWGKVFSTAPEVLRTLYPRYADFEEL
FT                   VGRHDPEGTFRNAFLDRYFRR"

Задание 3. Поиск гомологов гена белка ENDOA_BACSU (ydcE) программой BLASTN

Программа BLASTN обнаружила 3 "гомологичных" участка с наименьшим E-value 0,82, причем их длины 16, 16 и 22. То есть ни о каком гене, гомологичном ydcE, не может идти и речи. В данном случае использование BLASTN не эффективно.


© SHADRINA О. А. 2010