Занятие 7.BLAST

Задание 1.Таблица 1. Результаты поиска гипотетических гомологов белка ABNA_BACSU:

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Accession P94522.3 1UV4_A ZP_03592670.1
E-value 0.0 4e-170 1e-167
Вес (в битах) 593 596 593
Процент идентичности 100% 100% 100%
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
27 11 486
3. "Худшая из хороших" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 32 24 1253
Accession P45982.1 3AKF_A ZP_03591487.1
E-value 0.006 0.21 0.001
Вес (в битах) 42 32.7 48.9
% идентичности 23% 24% 22%
% сходства 40% 44% 35%
Длина выравнивания 175 468 350
Координаты выравнивания (от-до, в запросе и в находке) 44-253/15-219 51-188/1-137 14-259/71-307
Число гэпов 45 (20%) 13/144(9%) 61(22%)
  • Исходный белок удалось найти в Swiss-Prot,а его структуру в банке PDB.Белок в "nr" имеет другой AC, отличается штамм организмов.
  • Максимальное число гомологов найдено в банке NR, минимальное - в PDB. В первую очередь, это связано с количеством белков,собранных в этих базах данных. PDB содержит структуры белков, а NR содержит все возможные последовательности из разных источников.
  • В банке SwissProt найдено 39 возможных гомологов (E-value последнего: 8.2), в банке PDB 40 (E-value последнего: 9.8),в NR - 2016 (E-value последнего: 9.8). Число находок было лимитировано значением E-value=10.

Задание 2.Таблица 2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам:

Гипотетический гомолог моего белка ABNA_BACSU был найден в таксоне Actinobacteria (другой отдел того же царства бактерий).Я думаю, находка удачная:при том, что бактерии относятся к разным отделам, у них хорошие проценты сходства и идентичности, неплохой Е-value.
Гипотетический гомолог
Найдено в таксоне Actinobacteria
Accession ADW02239.1
E-value 2e-71
Вес (в битах) 270
% идентичности 46%
% сходства 63%
Длина выравнивания 323
Координаты выравнивания (от-до, в запросе и в находке) 5-321/3-320
Число гэпов 11/323(3%)

Задание 3:

Белки: ABNA_BACSU (организм:Bacillus subtilis) и YAGH_ECOLI (организм:Escherichia coli)
Программы :Stretcher (оптимальное полное выравнивание) и Matcher (оптимальное частичное выравнивание), BLAST
Параметры:
Matrix: EBLOSUM62
Gap_penalty: 12.0
Extend_penalty: 1.0

Выравнивание BLAST:

Score = 48.2 bits (108),  Expect = 5e-10, Method: Compositional matrix adjust.  
Identities = 66/263 (25%), Positives = 103/263 (39%), Gaps = 43/263 (16%)            
                                                                                      
Query  44   DPTMIKEGSSWYALGTGLTEERGLRVLKSSDAKNWTVQKSIFTTPLSWWSNYV----PNY  99          
            DP++ ++G  +Y   +      G+R+  S D KNW    S+ +TPL   S       P+               
Sbjct  14   DPSLCRQGEDYYIATSTFEWFPGVRIYHSRDLKNW----SLVSTPLDRVSMLDMKGNPDS  69          
Query  100  GQNQWAPDIQYYNGKYWLYYSVSSFGSNTSAIG---LASSTSISSGGWKDEGLVIRSTSS  156         
            G   WAP + Y +GK+WL Y+      +    G   L ++ SI  G W +                        
Sbjct  70   G-GIWAPCLSYADGKFWLLYTDVKIVDSPWKNGRNFLVTAPSIE-GPWSE-------PIP  120         
Query  157  NNYNAIDPELTFDKDGNPWLAF----GSFWSGIKLTKLDKSTMKPTGSLYSIAARPNNGG  212         
                  DP L  D DG  +  +        S    T + ++    TG+L         G               
Sbjct  121  MGNGGFDPSLFHDDDGRKYYIYRPWGPRHHSNPHNTIVLQAFDPQTGTLSPERKTLFTGT  180         
Query  213  AL---EAPTLTYQNGYYYLMVSFDKCCDGVNSTYKIAYGRSKSITGPYLDKSGKSML---  266         
             L   E   L    G+YYLM +      G +  + +   RSK+I GPY      +M+                 
Sbjct  181  PLCYTEGAHLYRHAGWYYLMAA----EGGTSYEHAVVVLRSKNIDGPYELHPDVTMMTSW  236         
Query  267  ---------EGGGTILDSGNDQW  280                                              
                      G G++L +   +W                                                   
Sbjct  237  HLPENPLQKSGHGSLLQTHTGEW  259                                              
Score = 16.7 bits (31),  Expect = 1.2, Method: Compositional matrix adjust.          
Identities = 7/12 (58%), Positives = 7/12 (58%), Gaps = 0/12 (0%)                    
Query  110  YYNGKYWLYYSV  121                                                         
            YYN K W Y  V                                                              
Sbjct  413  YYNSKNWSYCFV  424 

Локальное выравнивание (Matcher):

      Length: 314                    
      Identity:      75/314 (23.9%)  
      Similarity:   120/314 (38.2%)  
      Gaps:          60/314 (19.1%)  
      Score: 131                     
                                                                                
            20        30        40            50                                      
YAGH_E DPSLCRQGEDYYIATSTFEWFPGVRIYHSRDLKNW----SLVSTPLDRVS                             
       ::.. ..:  .:   .      :.:.  : : :::    :. .:::   :                             
ABNA_B DPTMIKEGSSWYALGTGLTEERGLRVLKSSDAKNWTVQKSIFTTPLSWWS                             
            50        60        70        80        90                                
                                                                                      
      60        70         80        90       100                                     
YAGH_E MLDMKGNPDSG-GIWAPCLSYADGKFWLLYTDVKIVDSPWKNGRNFLVTA                             
              :. :   ::: . : .::.:: :.      .    :   : ..                             
ABNA_B NYV----PNYGQNQWAPDIQYYNGKYWLYYSVSSFGSNTSAIG---LASS                             
               100       110       120       130                                      
                                                                                      
      110               120       130       140       150                             
YAGH_E PSIE-GPWSEP-------IPMGNGGFDPSLFHDDDGRKYYIYRPWGPRHH                             
        ::  : : .                :: :  : ::  .  .  .                                  
ABNA_B TSISSGGWKDEGLVIRSTSSNNYNAIDPELTFDKDGNPWLAFGSFW----                             
        140       150       160       170       180                                   
                                                                                      
              160       170       180       190       200                             
YAGH_E SNPHNTIVLQAFDPQTGTLSPERKTLFTGTPLCYTEGAHLYRHAGWYYLM                             
       :    : . ..    ::.:         :  :   :   :    :.::::                             
ABNA_B SGIKLTKLDKSTMKPTGSLYSIAARPNNGGAL---EAPTLTYQNGYYYLM                             
            190       200       210          220                                      
                                                                                      
                  210       220       230       240                                   
YAGH_E AAEG----GTSYEHAVVVLRSKNIDGPYELHPDVTMMTSWHLPENPLQKS                             
        .      : .  . .   :::.: :::      .:.                                          
ABNA_B VSFDKCCDGVNSTYKIAYGRSKSITGPYLDKSGKSML------------E                             
     230       240       250       260                                                
                                                                                      
        250       260       270       280         290                                 
YAGH_E GHGSLLQTHTGEWYMAYLTSRPLRLPGVPLLASGGR--GYCPLGRETGIA                             
       : :..: .   .:          . ::   . .:     .     . ::                              
ABNA_B GGGTILDSGNDQW----------KGPGGQDIVNGNILVRHAYDANDNGIP                             
       270       280                 290       300                                    
                                                                                      
               300                                                                    
YAGH_E RI-----EWRDGWP                                                                 
       ..      :  :::                                                                 
ABNA_B KLLINDLNWSSGWP                                                                 
       310       320        

Полное выравнивание (Stretcher):

      Length: 585                  
      Identity:      95/585 (16.2%)
      Similarity:   136/585 (23.2%)
      Gaps:         311/585 (53.2%)
      Score: -131                  
                                10                      20                       
      YAGH_E ME----------------ITNPILTGFNP--------------DPSLCRQ                       
             :.                    : :   :              ::.. ..                       
      ABNA_B MKKKKTWKRFLHFSSAALAAGLIFTSAAPAEAAFWGASNELLHDPTMIKE                       
                     10        20        30        40        50                       
                                                                                      
                     30        40            50        60                             
      YAGH_E GEDYYIATSTFEWFPGVRIYHSRDLKNW----SLVSTPLDRVSMLDMKGN                       
             :  .:   .      :.:.  : : :::    :. .:::   :                              
      ABNA_B GSSWYALGTGLTEERGLRVLKSSDAKNWTVQKSIFTTPLSWWSNYV----                       
                     60        70        80        90                                 
                                                                                      
               70         80        90       100       110                            
      YAGH_E PDSG-GIWAPCLSYADGKFWLLYTDVKIVDSPWKNGRNFLVTAPSIE-GP                       
             :. :   ::: . : .::.:: :.      .    :   : .. ::  :                        
      ABNA_B PNYGQNQWAPDIQYYNGKYWLYYSVSSFGSNTSAIG---LASSTSISSGG                       
              100       110       120       130          140                          
                                                                                      
                       120       130       140       150                              
      YAGH_E WSEP-------IPMGNGGFDPSLFHDDDGRKYYIYRPWGPRHHSNPHNTI                       
             : .                :: :  : ::  .  .  .     :    :                        
      ABNA_B WKDEGLVIRSTSSNNYNAIDPELTFDKDGNPWLAFGSF----WSGIKLTK                       
                 150       160       170       180                                    
                                                                                      
             160       170       180       190       200                              
      YAGH_E VLQAFDPQTGTLSPERKTLFTGTPLCYTEGAHLYRHAGWYYLMAAEG---                       
             . ..    ::.:         :  :   :   :    :.:::: .                            
      ABNA_B LDKSTMKPTGSLYSIAARPNNGGAL---EAPTLTYQNGYYYLMVSFDKCC                       
           190       200       210          220       230                             
                                                                                      
                 210       220       230       240       250                          
      YAGH_E -GTSYEHAVVVLRSKNIDGPYELHPDVTMMTSWHLPENPLQKSGHGSLLQ                       
              : .  . .   :::.: :::                  : :::  :.:.                       
      ABNA_B DGVNSTYKIAYGRSKSITGPY------------------LDKSGK-SMLE                       
              240       250                         260                               
                                                                                      
                 260       270       280       290       300                          
      YAGH_E THTGEWYMAYLTSRPLRLPGVPLLASGGRGYCPLGRETGIARIEWRDGWP                       
                                :  .: ::                   : :                        
      ABNA_B G------------------GGTILDSGN------------------DQW-                       
                               270                         280                        
                                                                                      
                 310       320       330         340       350                        
      YAGH_E YVEGGKHAQLTVKGPQVAEQPAAVPGNW--RDDFDASSLDPELQTLRIPF                       
                         :::   .    : ::   :  .::.                                    
      ABNA_B ------------KGPGGQD---IVNGNILVRHAYDAND------------                       
                                   290       300                                      
                                                                                      
                   360       370       380       390       400                        
      YAGH_E DDTLGSLTARPGFLRLYGNDSLNSTFTQSTVARRWQHFAFRAETRMEFSP                       
                        :  .:  ::                                                     
      ABNA_B ----------NGIPKLLINDL-----------------------------                       
                           310                                                        
                                                                                      
                   410       420       430       440       450                        
      YAGH_E VHFQQSAGLTCYYNSKNWSYCFVDYEEGQGRTIKVIQLDHNVPSWPLHEQ                       
                             :::                         :: .                         
      ABNA_B ----------------NWS-----------------------SGWPSY--                       
                                                       320                            
                                                                                      
                   460       470       480       490       500                        
      YAGH_E PIPVPEHAESVWLRVDVDTLVYRYSYSFDGETWHTVPVTYEAWKLSDDYI                       
                                                                                      
      ABNA_B --------------------------------------------------                       
                                                                                      
                                                                                      
                   510       520       530                                            
      YAGH_E GGRGFFTGAFVGLHCEDISGDGCYADFDYFTYEPV                                      
                                                                                      
      ABNA_B -----------------------------------    

Сравнение выравниваний

BLASTP Stretcher Matcher
Bec 108 131 131
Длина выравнивания 263 585 314
% идентичности 25 16.2 23.9
% сходства 39 23.2 38.2
гэпы,% 16 53.2 19.1
Локальные выравнивания BLAST и Matcher: % сходства отличается на 0.8%,% идентичности-на 1.1%, вес-на 23 единицы, %гэпов - на 3.1. Веса выравниваний Matcher и Stretcher совпали. Локальное выравнивание и выравнивание в BLAST в целом совпадает с локальным выравниванием Matcher.Расхождения: в Matcher: в позициях 95-98 белка ABNA_B стоят гэпы, в позициях 110-117 гэпы поставлены между остатками Е и Р белка YAGH_E, в BLAST -между Р и I. Выравнивание Matcher длиннее на 60 остатков (по белку ABNA_B). В полном выравнивании в позициях 205 -209 гэпы стоят между остатками G----G, в BLAST смещено за 1 остаток назад, то же самое в позициях 263-277 (по белку ABNA_B).



© Акулич Ксения,2010