На главную
Назад











Занятие 7. BLAST

Обязательные задания

  1. Поиск гипотетических гомологов изучаемого белка в разных банках
  2. Таблица 1. Результаты поиска гипотетических гомологов белка Pyrf_BACSU

      Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
    1. Лучшая находка
    Accession p25971.1 1DBT A NP_389438.1
    E-value 8e-138 6e-139 2e-136
    Вес (в битах) 489 489 489
    Процент идентичности 100% 100% 100%
    Белки с теми же значениями E-value и веса в битах не найдены
         
    2. Число хороших кандидатов в гомологи
    (число находок в списке описаний с E-value < 1E-10)
    100 5 100
    3. "Худшая из хороших" находка (последняя в выдаче с E-value < 1)
    Номер находки в списке описаний 100 62 500(9e-40)
    Accession A8FVN0 2EAB A ZP_06176114.1
    E-value 9e-41 0.99 9e-40
    Вес (в битах) 166 30 167
    % идентичности 45% 29% 51%
    % сходства 60% 42% 66%
    Длина выравнивания 230 92 235
    Координаты выравнивания 3-231 и 2-227 123-211 и 228-319 1-234 и 9-242
    Число гэпов 5 3 2

    Kомментарии к таблице

  3. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
  4. Гомолог нашелся среди эукариот (Drosophila melanogaster).
    Номер находки: 1
    Accession: Q01637
    E-value: 6e-08
    Вес: 56.6
    %Идентичности:28
    %Сходства:44
    Длина выравнивания:191
    Координаты выравнивания:51-231 и 309-480
    число гэпов:29

  5. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
  6. Выравнивание, полученое программой BLAST

     
      Lenght = 191
      Score = 56.6 bits (135)
      Identities = 54/191 (28%) 
      Positives = 84/191 (44%)
      Gaps = 29/191 (15%)
    
    Query  51   KERNCELFLDLKLHDIPTTVN----KAMKRLASLGVDLVNVHAAGGKKMMQAALEGLEEG  106
                +  N  L  D K  DI  TV+    K + +++S   DLV  H   G+ ++Q    GL EG
    Sbjct  309  QRHNFLLMEDRKFADIGNTVSLQYGKGIYKISSW-ADLVTAHTLPGRSILQGLKAGLGEG  367
    
    Query  107  TPAGKKRPSLI-----AVTQLTSTSEQIMKDELLIEKSLIDTVVHYSKQAEESGLDGVVC  161
                  AGK+R   +     A   L     +   +++  E + +D V             GVVC
    Sbjct  368  -GAGKERGVFLLAEMSASGNLIDAKYKENSNKIATEGADVDFVA------------GVVC  414
    
    Query  162  SVHEAKAIYQAVSPSFLTVTPGIRMSEDAANDQVRVATP-AIAREKGSSAIVVGRSITKA  220
                   +A A      P  L +TPG+++ E       +  +P  + +E+G+   VVGR I KA
    Sbjct  415  QSSDAFAF-----PGLLQLTPGVKIDEGVDQLGQQYQSPEHVVKERGADIGVVGRGILKA  469
    
    Query  221  EDPVKAYKAVR  231
                  P +A +  R
    Sbjct  470  SSPKQAAQTYR  480 


    Выравнивание, полученое программой water:

     
      Length: 186
      Identity:      54/186 (29.0%)
      Similarity:    85/186 (45.7%)
      Gaps:          19/186 (10.2%)
      Score: 141.0
     
    
    PYRF_BACSU        51 KERNCELFLDLKLHDIPTTVN----KAMKRLASLGVDLVNVHAAGGKKMM     96
                         :..|..|..|.|..||..||:    |.:.:::| ..|||..|...|:.::
    PYR5_DROME       309 QRHNFLLMEDRKFADIGNTVSLQYGKGIYKISS-WADLVTAHTLPGRSIL    357
    
    PYRF_BACSU        97 QAALEGLEEGTPAGKKRPSLIAVTQLTSTSEQIMKDELLIEKSLIDTVVH    146
                         |....||.|| .|||:|...:....  |.|..::..:.....:.|.|   
    PYR5_DROME       358 QGLKAGLGEG-GAGKERGVFLLAEM--SASGNLIDAKYKENSNKIAT---    401
    
    PYRF_BACSU       147 YSKQAEESGLDGVVCSVHEAKAIYQAVSPSFLTVTPGIRMSEDAANDQVR    196
                           :.|:...:.||||...:|.|.     |..|.:|||:::.|.......:
    PYR5_DROME       402 --EGADVDFVAGVVCQSSDAFAF-----PGLLQLTPGVKIDEGVDQLGQQ    444
    
    PYRF_BACSU       197 VATPA-IAREKGSSAIVVGRSITKAEDPVKAYKAVR    231
                         ..:|. :.:|:|:...||||.|.||..|.:|.:..|
    PYR5_DROME       445 YQSPEHVVKERGADIGVVGRGILKASSPKQAAQTYR    480 


    Выравнивание, полученое программой needle:

      Length: 508
      Identity:      64/508 (12.6%)
      Similarity:   104/508 (20.5%)
      Gaps:         284/508 (55.9%)
      Score: 134.0
      
    
    PYRF_BACSU         0 --------------------------------------------------      0
                                                                           
    PYR5_DROME         1 MVAQNSDKMRALALKLFEINAFKFGDFKMKVGINSPVYFDLRVIVSYPDV     50
    
    PYRF_BACSU         0 --------------------------------------------------      0
                                                                           
    PYR5_DROME        51 MQTVSDLLVEHIKDKQLSAKHVCGVPYTALPLATIVSVQQGTPMLVRRKE    100
    
    PYRF_BACSU         0 --------------------------------------------------      0
                                                                           
    PYR5_DROME       101 AKAYGTKKLVEGIFNAGDTCLIVEDVVTSGSSILDTVRDLQGEGIVVTDA    150
    
    PYRF_BACSU         0 --------------------------------------------------      0
                                                                           
    PYR5_DROME       151 VVVVDREQGGVANIAKHGVRMHSLFTLSFLLNTLHEAGRIEKSTVEAVAK    200
    
    PYRF_BACSU         0 --------------------------------------------------      0
                                                                           
    PYR5_DROME       201 YIAAVQINSDGTFVGGDKGDVVRANDLQRTKLTYENRANLAKSAVAKRLF    250
    
    PYRF_BACSU         1 -----MKNNLPIIALDFASAEETLAFLAPFQQEPLFVKVGMELFYQEGPS     45
                              .:.|| .:|.|...|:|.|............:|..:::.......
    PYR5_DROME       251 NLIASKQTNL-CLAADLTHADEILDVADKCGPYICLLKTHVDIVEDFSDK    299
    
    PYRF_BACSU        46 IVKQL----KERNCELFLDLKLHDIPTTVN----KAMKRLASLGVDLVNV     87
                         .:..|    :..|..|..|.|..||..||:    |.:.:::| ..|||..
    PYR5_DROME       300 FIADLQALAQRHNFLLMEDRKFADIGNTVSLQYGKGIYKISS-WADLVTA    348
    
    PYRF_BACSU        88 HAAGGKKMMQAALEGLEEGTPAGKKRPSLIAVTQLTSTSEQIMKDELLIE    137
                         |...|:.::|....||.|| .|||:|...:....  |.|..::..:....
    PYR5_DROME       349 HTLPGRSILQGLKAGLGEG-GAGKERGVFLLAEM--SASGNLIDAKYKEN    395
    
    PYRF_BACSU       138 KSLIDTVVHYSKQAEESGLDGVVCSVHEAKAIYQAVSPSFLTVTPGIRMS    187
                         .:.|.|     :.|:...:.||||...:|.|.     |..|.:|||:::.
    PYR5_DROME       396 SNKIAT-----EGADVDFVAGVVCQSSDAFAF-----PGLLQLTPGVKID    435
    
    PYRF_BACSU       188 EDAANDQVRVATPA-IAREKGSSAIVVGRSITKAEDPVKAYKAVRLE-WE    235
                         |.......:..:|. :.:|:|:...||||.|.||..|.:|.:..|.. |.
    PYR5_DROME       436 EGVDQLGQQYQSPEHVVKERGADIGVVGRGILKASSPKQAAQTYRDRLWA    485
    
    PYRF_BACSU       236 GIKS----    239
                         ..:.    
    PYR5_DROME       486 AYQDRVAK    493


    Длины выравниваний Water`ом и BLAST`ом почти одинаковы (186 и 191 соотв.), а для needle 508.
    идентичность и сходство water и BLAST различаются на 1%, число гэпов - на 5% (10 и 15 соотв.)
    135 score для Blast, 141 для water и 134 для needle
    1.В целом, выравнивание water очень похоже на BLAST, но в BLAST в позиции 18-22 для pyrf_BACSU есть 5 гэпов
    ,а в water нет (там буквы). с 399 по 411 в белке дрозофилы в Blast стоят гэпы, а в water нет.
    Таким образом, из-за большего числа гэпов Blast после 417-422 (5 гэпов в water и blast) буквы снова идут
    в соответствии друг другу. 2. До 255 буквы в Blast в needle стоят гэпы, после, до 51, соответствия мало, после 51
    needle похож на water (меньше гэпов чем в blast) .
    Вообще pyr5_drome мало похож на pyrf_bacsu, но, например на участке 158-161 и 411-414 одинаковы "GVVC"
    или, на участке 212-220 и 461-469 "VVGR*I*KA", где "*" это 1 пара разных букв. Еще есть места где выравнивания
    просто похожи: 183-190 и 436-343 "+TPG+++"