Занятие 7. BLAST



Задание 1.

Таблица 1. Результаты поиска гипотетических гомологов белка ENDOA_BACSU

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка
Accession P96622.1 1NE8_A NP_388347.1
E-value 2e-61 3e-62 6e-60
Вес (в битах) 233 232 233
Процент идентичности 100% 100% 100%
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
9 1 455
3. "Худшая из хороших" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 11 19 937
Accession P0AE71.1 1BA0_A YP_002909907.1
E-value 7e-04 0.99 0.98
Вес (в битах) 42.4 28.1 37
% идентичности 32% 38% 32%
% сходства 49% 48% 42%
Длина выравнивания 78 58 107
Координаты выравнивания (от-до, в запросе и в находке) 6-83(ENDOA_BACSU)

10-81 (MAZF_ECO57)

16-66(ENDOA_BACSU)

17-72

4-108(ENDOA_BACSU)

8-112

Число гэпов 6 9 4

Белок удалось найти во всех базах. Число явных гомологов меньше всего в PDB, что можно объяснить, возможно, тем, что не для всех белков построены структуры. В nr данные о белках поступают со всех возможных банков, поэтому поиск обширнее и, соответственно, больше находок.
В Swiss-Prot было найдено 24 белка, E-value последнего 8,9, таким образом, в данном случае количество находок было ограничено их наличием в базе. В PDB было найдено 52 белка, E-value последнего 9,3, как и в предыдущем случае количество находок было ограничено их наличием в базе. В "nr" первоначально количество находок было ограничено параметрами, в списке была сотня гомологов с E-value последнего 3e-41, при изменении настроек обнаружилось 1009 белков с E-value последнего 9,7.

Задание 2.

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

К сожалению, при поиске по таксонам наиболее близким белком оказался Q81SV3.1(Y1542_BACAN), с E-Value - 0,18. При этом поиск был проведен по Bacillus anthracis. Таксономия организма белка Y1542_BACAN:Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group.
Номер находки в списке описаний 1
Accession Q81SV3.1
E-value 0,18
Вес (в битах) 25,8
% идентичности 29%/td>
% сходства 48%
Длина выравнивания 79
Координаты выравнивания (от-до, в запросе и в находке) 28-105(ENDOA_BACSU)

97-165 (Y1542_BACAN)

Число гэпов 11


Задание 3.

Локальные выравнивания, выполненные программами BLAST и water, одинаковы. В соответствии с этим, одинаковы их длина, вес, проценты сходства и идентичности, кол-во гэпов. Глобальное выравнивание (needle) имеет с локальными одинаково выровненный участок (28-105 по ENDOA_BACSU), то есть отличается только выравниванием концевых участков, невошедших в локальные. При этом длинна белка ENDOA_BACSU значительно меньше, чем Y1542_BACAN, отсюда большое количкство гэпов, меньший вес, проценты идентичности и сходства. К тому же, выравнивания концевых участков достаточно подозрительны, по ним нельзя судить о гомологичности этих белков.

Выравнивание BLAST

1: ENDOA_BACSU
2: Y1542_BACAN
Matrix: EBLOSUM62
Gap_penalty: 11.0
Extend_penalty: 1.0                                                                         
 
Score = 25.8 bits (55),  Expect = 3e-04, Method: Compositional matrix adjust.
 Identities = 23/79 (29%), Positives = 38/79 (48%), Gaps = 11/79 (14%)

Query  28   LVIQNDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVILLEQIRTIDKQ  86
            + IQ +  + F     VA +    +   LP H+E++ K R   ER    L E + +  ++
Sbjct  97   IYIQLNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FLEESVFSFRRE  150

Query  87   RLTDKITHLDDEMMDKVDE  105
            RL  +I    DE +DK D+
Sbjct  151  RLLKQI----DEALDKQDK  165
 

Локальное выравнивание (water)

 1: ENDOA_BACSU                                                                        
 2: Y1542_BACAN                                                                                                                                                                             
 Matrix: EBLOSUM62                                                                                                                                                                        
 Gap_penalty: 11.0                                                                                                                                                                                                         
 Extend_penalty: 1.0                                                                                                                                               
                                                                                                                                                                   
 Length: 79                                                                                                                                                        
 Identity:      23/79 (29.1%)                                                                                                                                      
 Similarity:    38/79 (48.1%)                                                                                                                                      
 Gaps:          11/79 (13.9%)                                                                                                                                      
 Score: 55.0                                                                                                                                                       
                                                                                                                                                                   
                                                                                                                                                                   
=======================================                                                                                                                            
                                                                                                                                                                   
NDOA_BACSU       28 LVIQNDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVIL     76                                                                                      
                    :.||.:..:.|.....||.:.   :...||.|:|::.| |...||   .|          
1542_BACAN       97 IYIQLNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FL    140   
                                                                                
NDOA_BACSU       77 LEQIRTIDKQRLTDKITHLDDEMMDKVDE    105                        
                    .|.:.:..::||..:|    ||.:||.|:                               
1542_BACAN      141 EESVFSFRRERLLKQI----DEALDKQDK    165 

Глобальное выравнивание (needle)

 1: ENDOA_BACSU                                                                
 2: Y1542_BACAN                                                                                          
 Matrix: EBLOSUM62                                                             
 Gap_penalty: 11.0                                                             
 Extend_penalty: 1.0                                                           
                                                                               
 Length: 190                                                                   
 Identity:      28/190 (14.7%)                                                 
 Similarity:    50/190 (26.3%)                                                 
 Gaps:          86/190 (45.3%)                                                 
 Score: 33.0                                                                   
                                                                               
                                                                               
=======================================                                        
                                                                               
ENDOA_BACSU        0 --------------------------------------------------      0  
                                                                               
Y1542_BACAN        1 MNTPVSVNEKKDFVKWFLNNYQLKQRECVWILNYLMSHDQLMHKVHFVEH     50  
                                                                               
ENDOA_BACSU        1 ------------MIVKRGDVYFADLSPVVGSEQGGVRPV-------LVIQ     31  
                                ..||....:|...:.:....:.....:       :.||         
Y1542_BACAN       51 AKYCPRGLVMSANCVKDTPFHFFKQNVMTTDAEKSFHDIRLNRDEDIYIQ    100  
                                                                               
ENDOA_BACSU       32 NDIGNRFSPTAIVAAITAQIQKAKLPTHVEIDAK-RYGFERDSVILLEQI     80  
                    .:..:.|.....||.:.   :...||.|:|::.| |...||   .|.|.:         
Y1542_BACAN      101 LNFKSSFQNANYVAVLE---ENPYLPKHIEVNEKDRLLAER---FLEESV    144  
                                                                               
ENDOA_BACSU       81 RTIDKQRLTDKITHLDDEMMDKVDE----ALQISLALIDF    116            
                    .:..::||..:|    ||.:||.|:    .|...|.::                     
Y1542_BACAN      145 FSFRRERLLKQI----DEALDKQDKEAFHRLTAELKML--    178


          

© SHADRINA О. А. 2010