BLASTP
на главную| Поиск по БД Swiss-Prot | Поиск по БД PDB | Поиск по БД "nr" | |
| 1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
| Идентификатор БД | RBSB_ECOLI | 1URP | NP_418207.1 |
| E-value | 4e-167 | 2e-154 | 7e-166 |
| Вес (в битах) | 586 | 540 | 586 |
| % идентичности | 100% | 100% | 100% |
| Найдены ли другие белки с теми же значениями E-value и веса в битах? Если найдены, то укажите общее число и приведите один идентификатор |
не найдены | не найдены | не найдены |
| 2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value < 1E-10) | 25 | 24 | 99 |
| 2. "Худшая" находка (последняя в выдаче с E-value < 1) | |||
| Номер находки в списке описаний (Descriptions) | 124 | 90 | 6809 |
| Идентификатор БД | PYRD_SCHPO | 2TOH | YP_480637.1 |
| E-value | 0.84 | 0.74 | 0.99 |
| Вес (в битах) | 34.3 | 30.4 | 38.1 |
| % идентичности | 29% | 25% | 58% |
| % сходства | 49% | 43% | 78% |
| Длина выравнивания | 71 | 343 | 293 |
| Координаты выравнивания (номера первых и последних а.о.) | query:с 218 по 281 а.о. sbjct: c 364 по 434 а.о. |
query:с 92 по 171 а.о. sbjct: с 34 по 102 |
query:с 3 по 295 а.о. sbjct: с 1 по 293 |
| % гэпов | 9% | 7% | 16% |
Вес в битах совпадает в Swiss-Prot и "nr" (586). Вес в PDB меньше (540), т.к. туда вошла лишь часть последовательности.
E-value выше всего в PDB (2e-154), т.к. была взята часть последовательности, поэтому вероятность случайного нахождения гомолога выше. E-value в банке Swiss-Prot (4e-167) меньше, чем в «nr» (7e-166).
Процент идентичности в трех банках равен 100% (белок сравнивался сам с собой)
Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Моя задача — для изучаемого белка E. coli найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого от E. coli. Для исследования предлагаются следующие таксоны: Homo sapiens, Archaea, Actinobacteria, Alteromonadales, Vibrionaceae (приведены в порядке приближения к E. coli). Критерий: E-value<0,001.Найден лучший гомолог в организме таксона Actinobacteria (taxid:201174)
| Номер находки в списке описаний | 1 |
| Идентификатор БД | CELR_THEFU |
| E-value | 8e-13 |
| Вес (в битах) | 69.3 |
| % идентичности | 28% |
| % сходства | 45% |
| Длина выравнивания | 340 |
| Координаты выравнивания (номера первых и последних а. о.) | query:с 27 по 248 sbjct:с 65 по 292 |
| % гэпов | 8% |
Поиск белка по его фрагменту
Дан фрагмент:>seq2 IPVFLLDRSIDVKDKSLYMTTVTADN
С помощью SRS я нашла полную последовательность белка:
Swiss-Prot ID: YTFQ_ECOLI
Swiss-Prot AC: P39325; Q2M678
>seq2
MWKRLLIVSA VSAAMSSMAL AAPLTVGFSQ VGSESGWRAA ETNVAKSEAE KRGITLKIAD
GQQKQENQIK AVRSFVAQGV DAIFIAPVVA TGWEPVLKEA KDAEIPVFLL DRSIDVKDKS
LYMTTVTADN ILEGKLIGDW LVKEVNGKPC NVVELQGTVG ASVAIDRKKG FAEAIKNAPN
IKIIRSQSGD FTRSKGKEVM ESFIKAENNG KNICMVYAHN DDMVIGAIQA IKEAGLKPGK
DILTGSIDGV PDIYKAMMDG EANASVELTP NMAGPAFDAL EKYKKDGTMP EKLTLTKSTL
YLPDTAKEEL EKKKNMGY
| Поиск по фрагменту | Поиск по полной последовательности |
|
| АС лучшей находки | P39325 | P39325 |
| E-value | 1e-17 | 0.0 |
| Вес (в битах) | 86.7 | 645 |
| Найдены ли другие белки с теми же значениями E-value и веса в битах? |
не найдены | не найдены |
Т.к. вес полной последовательности белка больше, чем вес фрагмента, то E-value полной последовательности будет меньше (0.0 < 1e-17).
Среди результатов последнего поиска есть выравнивание YTFQ_ECOLI (query) с моим изучаемым белком RBSB_ECOLI (sbjct):
Query 1 MWKRLLIVSAV--SAAMSSMALAAPLTVGFSQVGSESGWRAAETNVAKSEAEKRGITLKI 58
M K +VSAV SA +S+ A+A T+ + + + + A+ EA+K G L +
Sbjct 3 MKKLATLVSAVALSATVSANAMAKD-TIALVVSTLNNPFFVSLKDGAQKEADKLGYNLVV 61
Query 59 ADGQQKQENQIKAVRSFVAQGVDAIFIAPVVATGWEPVLKEAKDAEIPVFLLDRSIDVKD 118
D Q ++ V+ +G + I P + +K A A IPV LDR
Sbjct 62 LDSQNNPAKELANVQDLTVRGTKILLINPTDSDAVGNAVKMANQANIPVITLDRQ---AT 118
Query 119 KSLYMTTVTADNILEGKLIGDWLVKEVNGKPCNVVELQGTVGASVAIDRKKGFAEAIKNA 178
K ++ + +DN+L GK+ GD++ K+ G+ V+ELQG G S A +R +GF +A+ A
Sbjct 119 KGEVVSHIASDNVLGGKIAGDYIAKKA-GEGAKVIELQGIAGTSAARERGEGFQQAVA-A 176
Query 179 PNIKIIRSQSGDFTRSKGKEVMESFIKAENNGKNICMVYAHNDDMVIGAIQAIKEAGLKP 238
++ SQ DF R KG VM++ + A ++ V+A ND+M +GA++A++ AG
Sbjct 177 HKFNVLASQPADFDRIKGLNVMQNLLTAH---PDVQAVFAQNDEMALGALRALQTAG--- 230
Query 239 GKDILTGSIDGVPDIYKAMMDGEANASVELTPNMAG 274
D++ DG PD KA+ DG+ A++ P+ G
Sbjct 231 KSDVMVVGFDGTPDGEKAVNDGKLAATIAQLPDQIG 266
Выравнивание последовательностей seq1(RBSB_ECOLI) и seq2(YTFQ_ECOLI) с помощью GenDoc (из пробного выравнивания):
>seq1 IPVITLDRQATKGEVVSHIASDNVL >seq2 IPVFLLDRSIDVKDKSLYMTTVTADN

seq2 : IPVFLLDRSIDVKDKSLYMTTVTADN-- seq1 : IPVITLDRQAT---KGEVVSHIASDNVLс помощью BLASTP (фрагмент):
IPVFLLDRSIDVKDKSLYMTTVTADN IPV LDR K ++ + +DN IPVITLDRQ---ATKGEVVSHIASDNVLСравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
Параметры выравнивания в BLAST:
Сравним полученные три выравнивания
в BLAST:
YTFQ_ECOLI 1 MWKRLLIVSAV--SAAMSSMALAAPLTVGFSQVGSESGWRAAETNVAKSEAEKRGITLKI 58
M K +VSAV SA +S+ A+A T+ + + + + A+ EA+K G L +
RBSB_ECOLI 3 MKKLATLVSAVALSATVSANAMAKD-TIALVVSTLNNPFFVSLKDGAQKEADKLGYNLVV 61
YTFQ_ECOLI 59 ADGQQKQENQIKAVRSFVAQGVDAIFIAPVVATGWEPVLKEAKDAEIPVFLLDRSIDVKD 118
D Q ++ V+ +G + I P + +K A A IPV LDR
RBSB_ECOLI 62 LDSQNNPAKELANVQDLTVRGTKILLINPTDSDAVGNAVKMANQANIPVITLDRQ---AT 118
YTFQ_ECOLI 119 KSLYMTTVTADNILEGKLIGDWLVKEVNGKPCNVVELQGTVGASVAIDRKKGFAEAIKNA 178
K ++ + +DN+L GK+ GD++ K+ G+ V+ELQG G S A +R +GF +A+ A
RBSB_ECOLI 119 KGEVVSHIASDNVLGGKIAGDYIAKKA-GEGAKVIELQGIAGTSAARERGEGFQQAVA-A 176
YTFQ_ECOLI 179 PNIKIIRSQSGDFTRSKGKEVMESFIKAENNGKNICMVYAHNDDMVIGAIQAIKEAGLKP 238
++ SQ DF R KG VM++ + A ++ V+A ND+M +GA++A++ AG
RBSB_ECOLI 177 HKFNVLASQPADFDRIKGLNVMQNLLTAH---PDVQAVFAQNDEMALGALRALQTAG--- 230
YTFQ_ECOLI 239 GKDILTGSIDGVPDIYKAMMDGEANASVELTPNMAG 274
D++ DG PD KA+ DG+ A++ P+ G
RBSB_ECOLI 231 KSDVMVVGFDGTPDGEKAVNDGKLAATIAQLPDQIG 266
Глобальное выравнивание:
RBSB_ECOLI 1 MNMKKLATLVSAVALSATVSANAMAKD-TIALVVSTLNNPFFVSLKDGAQ 49
|.|...:|||| ||.:|:.|:|.. |:........:.:..:..:.|:
YTFQ_ECOLI 1 --MWKRLLIVSAV--SAAMSSMALAAPLTVGFSQVGSESGWRAAETNVAK 46
RBSB_ECOLI 50 KEADKLGYNLVVLDSQNNPAKELANVQDLTVRGTKILLINPTDSDAVGNA 99
.||:|.|..|.:.|.|.....::..|:....:|...:.|.|..:......
YTFQ_ECOLI 47 SEAEKRGITLKIADGQQKQENQIKAVRSFVAQGVDAIFIAPVVATGWEPV 96
RBSB_ECOLI 100 VKMANQANIPVITLDRQ---ATKGEVVSHIASDNVLGGKIAGDYIAKKA- 145
:|.|..|.|||..|||. ..|...::.:.:||:|.||:.||::.|:.
YTFQ_ECOLI 97 LKEAKDAEIPVFLLDRSIDVKDKSLYMTTVTADNILEGKLIGDWLVKEVN 146
RBSB_ECOLI 146 GEGAKVIELQGIAGTSAARERGEGFQQAVA-AHKFNVLASQPADFDRIKG 194
|:...|:||||..|.|.|.:|.:||.:|:. |....::.||..||.|.||
YTFQ_ECOLI 147 GKPCNVVELQGTVGASVAIDRKKGFAEAIKNAPNIKIIRSQSGDFTRSKG 196
RBSB_ECOLI 195 LNVMQNLLTAH---PDVQAVFAQNDEMALGALRALQTAG---KSDVMVVG 238
..||::.:.|. .::..|:|.||:|.:||::|::.|| ..|::...
YTFQ_ECOLI 197 KEVMESFIKAENNGKNICMVYAHNDDMVIGAIQAIKEAGLKPGKDILTGS 246
RBSB_ECOLI 239 FDGTPDGEKAVNDGKLAATIAQLPDQIGAKGVETADKVLKGEKVQAKYPV 288
.||.||..||:.||:..|::...|:..| .|...|:..|.....|.
YTFQ_ECOLI 247 IDGVPDIYKAMMDGEANASVELTPNMAG-----PAFDALEKYKKDGTMPE 291
RBSB_ECOLI 289 DLKLVVKQ------------------- 296
.|.|....
YTFQ_ECOLI 292 KLTLTKSTLYLPDTAKEELEKKKNMGY 318
Локальное выравнивание:
RBSB_ECOLI 3 MKKLATLVSAVALSATVSANAMAKD-TIALVVSTLNNPFFVSLKDGAQKE 51
|.|...:|||| ||.:|:.|:|.. |:........:.:..:..:.|:.|
YTFQ_ECOLI 1 MWKRLLIVSAV--SAAMSSMALAAPLTVGFSQVGSESGWRAAETNVAKSE 48
RBSB_ECOLI 52 ADKLGYNLVVLDSQNNPAKELANVQDLTVRGTKILLINPTDSDAVGNAVK 101
|:|.|..|.:.|.|.....::..|:....:|...:.|.|..:......:|
YTFQ_ECOLI 49 AEKRGITLKIADGQQKQENQIKAVRSFVAQGVDAIFIAPVVATGWEPVLK 98
RBSB_ECOLI 102 MANQANIPVITLDRQ---ATKGEVVSHIASDNVLGGKIAGDYIAKKA-GE 147
.|..|.|||..|||. ..|...::.:.:||:|.||:.||::.|:. |:
YTFQ_ECOLI 99 EAKDAEIPVFLLDRSIDVKDKSLYMTTVTADNILEGKLIGDWLVKEVNGK 148
RBSB_ECOLI 148 GAKVIELQGIAGTSAARERGEGFQQAVA-AHKFNVLASQPADFDRIKGLN 196
...|:||||..|.|.|.:|.:||.:|:. |....::.||..||.|.||..
YTFQ_ECOLI 149 PCNVVELQGTVGASVAIDRKKGFAEAIKNAPNIKIIRSQSGDFTRSKGKE 198
RBSB_ECOLI 197 VMQNLLTAH---PDVQAVFAQNDEMALGALRALQTAG---KSDVMVVGFD 240
||::.:.|. .::..|:|.||:|.:||::|::.|| ..|::....|
YTFQ_ECOLI 199 VMESFIKAENNGKNICMVYAHNDDMVIGAIQAIKEAGLKPGKDILTGSID 248
RBSB_ECOLI 241 GTPDGEKAVNDGKLAATIAQLPDQIG 266
|.||..||:.||:..|::...|:..|
YTFQ_ECOLI 249 GVPDIYKAMMDGEANASVELTPNMAG 274
Глобальное и BLASTP выравнивания отличаются следующими сопоставлениями:
в BLASTP: с 247 по 274 а.о.(YTFQ_ECOLI); с 239 по 266 (RBSB_ECOLI)
YTFQ_ECOLI 247 IDGVPDIYKAMMDGEANASVELTPNMAG 274
DG PD KA+ DG+ A++ P+ G
RBSB_ECOLI 239 FDGTPDGEKAVNDGKLAATIAQLPDQIG 266
RBSB_ECOLI 239 FDGTPDGEKAVNDGKLAATIAQLPDQIGAKGVETADKVLKGEKVQAKYPV 288
.||.||..||:.||:..|::...|:..| .|...|:..|.....|.
YTFQ_ECOLI 247 IDGVPDIYKAMMDGEANASVELTPNMAG-----PAFDALEKYKKDGTMPE 291
RBSB_ECOLI 289 DLKLVVKQ------------------- 296
.|.|....
YTFQ_ECOLI 292 KLTLTKSTLYLPDTAKEELEKKKNMGY 318
Т.к. выравнивание в BLASTP локальное, то выравнивание закончилось на позициях
274 и 266 в белках YTFQ_ECOLI и RBSB_ECOLI соответственно в отличие от глобального,
а началось в белке RBSB_ECOLI не с первой аминокислоты, а со второй.
Выравнивании в BLASTP и в локальном совпадают.
|   | BLASTP | needle | water |
| Длина | 276 | 327 | 276 |
| Идентичность | 31% | 28.7% | 31.9% |
| Сходство | 51% | 45.9% | 51.8% |
| Гэпы | 5% | 12.2% | 5.1% |
| Score(вес) | 311 | 326 | 332 |