BLASTP


На главную Назад

Таблица 1. Результаты поиска гипотетических гомологов белка PYRC_ECOLI

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка
Идентификатор БД PYRC_ECOLI 1XGE цепь A NP 415580.1
E-value 0.0 0.0 0.0
Вес (в битах) 726 720 726
% идентичности 100% 99% 100%
Найдены ли другие белки с теми же значениями E-value и веса в битах? не найдены не найдены не найдены
Сколько хороших кандидатов в гомологи найдено? 137 9 606
2. "Худшая" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний (Descriptions) 182 13 707
Идентификатор БД PYRC_THETN 2GWN цепь А ZP_03909514.1
E-value 0.89 0.10 0.99
Вес (в битах) 34.7 23.5 38.5
% идентичности 22% 27% 23%
% сходства 37% 46% 37%
Длина выравнивания 272 92 205
Координаты выравнивания (номера первых и последних а.о.) PYRC_ECOLI 43-289
PYRC_THETN 91-33
1XGE 178-264
2GWN 242-329
NP 415580.1 107-291
ZP 03909514.1 147-349
% гэпов 18% 9% 10%
Мне удалось найти мой белок в Swiss-Prot, "nr", а также его структуру в PDB. В Swiss-Prot и "nr" мой белок PYRC_ECOLI имеет 100% идентичности (при выравнивании его с самим собой), а в PDB 99% (345/347). Различия в выравнивании возникают между 103 а.о. (в моей последовательности PYRC_ECOLI в этой позиции стоит Лизин (L), а в выданной Blast'ом - Х), дальше в 120 позици PYRC_ECOLI стоит Изолейцин (I), а в выданной - Валин (V). Больше всего потенциальных гомологов было найдено в "nr" (Non-redundant protein sequences), связано это, как я думаю, с тем, что объем "nr" больше остальных. Самая хорошая из самых худших находок была найдена в БД PDB, т.к. её E-value самый низкий.

2). Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
  Поиск в таксоне Homo sapiens Поиск в таксоне Archaea Поиск в таксоне Actinobacteria Поиск в таксоне Alteromanadales Поиск в таксоне Vibrionaceae
Идентификатор БД нет нет нет PYRC_MARAV PYRC_VIBCH
E-value (<=0.001) - - - 5e-111 3e-110
Вес (в битах) - - - 395 392
% идентичности - - - 59% 55%
% сходства - - - 70% 67%
Длина выравнивания - - - 344 340
Координаты выравнивания (номера первых и последних а.о.) - - - PYRC_ECOLI 5-346
PYRC_MARAV 2-342
PYRC_ECOLI 8-347
PYRC_VIBCH 4-342
% гэпов - - - 1% 0%

3.Поиск белка по его фрагменту.
Фрагмент неизвестной последовательности:
>seq2 TTTEMALAYRDRIQAHNQTEQFSPLM
Результаты поиска белка в Swiss-Prot по фрагменту последовательности.
  Поиск по фрагменту Поиск по полной
последовательности
АС лучшей находки Q7MFB3 Q7MFB3
E-value 1e-18 0.0
Вес (в битах) 89.7 712
Найдены ли другие белки с теми же значениями E-value и веса в битах?
Нет Нет

В итоге мы установили последовательность, из которой был взят фрагмент, его AC - Q7MFB3, ID - PYRC_VIBVY, возникают только отличия в значениях E-value и Веса. Эти различия обусловлены тем, что поиск гомолога подразумевает большее количество сравниваемых белков.
Последовательность в fasta формате:
>sp|Q7MFB3|PYRC_VIBVY Dihydroorotase OS=Vibrio vulnificus (strain YJ016) GN=pyrC PE=3 SV=2
MTTLTITRPDDWHVHLRDGEVLADTVRDISRYNGRALIMPNTVPPVTTTEMALAYRDRIQ
AHNQTEQFSPLMSLYLTDNTTADEVRKAKASGAVVAAKLYPAGATTNSDSGVTDVKKIYP
VLQAMQEVGMLLLVHGEVTTHDVDIFDREKTFLDNVLAPIVQDFPDLKIVLEHITTSDAV
VFVKNANENVAATITAHHLLYNRNHMLVGGIKPHFYCLPILKRNTHQLALISAATSGNKK
FFLGTDSAPHAKGAKESACGCAGSYTAHAALELYAEVFEQAGKLENLEAFASHNGPDFYG
LPRNQDTITLVKDAWPVPASMPFGGDIVVPIRAGENMEWKVK


Cпомощью BLAST получим выравнивание белка PYRC_VIBVY с PYRC_ECOLI (красным цветом выделен фрагмент):
PYRC_VIBVY  4    LTITRPDDWHVHLRDGEVLADTVRDISRYNGRALIMPNTVPPVTTTEMALAYRDRI-QAH  62
                 L I RPDDWH+HLRDG++L   V   S   GRA++MPN  PPVTT E A+AYR RI  A 
PYRC_ECOLI  8    LKIRRPDDWHLHLRDGDMLKTVVPYTSEIYGRAIVMPNLAPPVTTVEAAVAYRQRILDAV  67

PYRC_VIBVY  63   NQTEQFSPLMSLYLTDNTTADEVRKAKASGAVVAAKLYPAGATTNSDSGVTDVKKIYPVL  122
                 F+PLM+ YLTD+   +E+ +    G   AAKLYPA ATTNS  GVT +  I PVL
PYRC_ECOLI  68   PAGHDFTPLMTCYLTDSLDPNELERGFNEGVFTAAKLYPANATTNSSHGVTSIDAIMPVL  127

PYRC_VIBVY  123  QAMQEVGMLLLVHGEVTTHDVDIFDREKTFLDNVLAPIVQDFPDLKIVLEHITTSDAVVF  182
                 + M+++GM LLVHGEVT  D+DIFDRE  F+++V+ P+ Q    LK+V EHITT DA  +
PYRC_ECOLI  128  ERMEKIGMPLLVHGEVTHADIDIFDREARFIESVMEPLRQRLTALKVVFEHITTKDAADY  187

PYRC_VIBVY  183  VKNANENVAATITAHHLLYNRNHMLVGGIKPHFYCLPILKRNTHQLALISAATSGNKKFF  242
                 V++ NE +AATIT  HL++NRNHMLVGG++PH YCLPILKRN HQ AL     SG  + F
PYRC_ECOLI  188  VRDGNERLAATITPQHLMFNRNHMLVGGVRPHLYCLPILKRNIHQQALRELVASGFNRVF  247

PYRC_VIBVY  243  LGTDSAPHAKGAKESACGCAGSYTAHAALELYAEVFEQAGKLENLEAFASHNGPDFYGLP  302
                 LGTDSAPHA+  KES+CGCAG + A  AL  YA VFE+   L++ EAF S NGP FYGLP
PYRC_ECOLI  248  LGTDSAPHARHRKESSCGCAGCFNAPTALGSYATVFEEMNALQHFEAFCSVNGPQFYGLP  307

PYRC_VIBVY  303  RNQDTITLVKDAWPVPASMPFGGDIVVPIRAGENMEWKVK  342
                  N   I LV++   V  S+    D +VP  AGE + W VK
PYRC_ECOLI  308  VNDTFIELVREEQQVAESIALTDDTLVPFLAGETVRWSVK  347


Выравнивание фрагмента, из задания 1 блока 2, не совпало с полученным нами выравнивании. Здесь (в последовательности выданной программой Blast) гэп стоит напротив Лейцина, а в выравнивании, полученном на прошлом занятии гэп стоит напротив Аспарагиновой к-ты.
4.Сравнение выравниваний PYRC_VIBVY и PYRC_ECOLI.

Для наглядности в оценке количественных параметров, выравниваний полученных спомощью разных програм, я составил таблицу:
  BLASTP Needle Water
Вес 950 952 954.0
Длина выравнивания 340 348 340
Процент идентичности 54% 53.4% 54.7%
Процент сходства 67% 66.1% 67.6%
а)Полное выравнивание в программе Needle последовательностей.
PYRC_VIBVY         1 ----MTTLTITRPDDWHVHLRDGEVLADTVRDISRYNGRALIMPNTVPPV     46
                         ...|.|.||||||:|||||::|...|...|...|||::|||..|||
PYRC_ECOLI         1 MTAPSQVLKIRRPDDWHLHLRDGDMLKTVVPYTSEIYGRAIVMPNLAPPV     50

PYRC_VIBVY        47 TTTEMALAYRDRI-QAHNQTEQFSPLMSLYLTDNTTADEVRKAKASGAVV     95
                     ||.|.|:|||.|| .|......|:|||:.||||:...:|:.:....|...
PYRC_ECOLI        51 TTVEAAVAYRQRILDAVPAGHDFTPLMTCYLTDSLDPNELERGFNEGVFT    100

PYRC_VIBVY        96 AAKLYPAGATTNSDSGVTDVKKIYPVLQAMQEVGMLLLVHGEVTTHDVDI    145
                     |||||||.|||||..|||.:..|.|||:.|:::||.||||||||..|:||
PYRC_ECOLI       101 AAKLYPANATTNSSHGVTSIDAIMPVLERMEKIGMPLLVHGEVTHADIDI    150

PYRC_VIBVY       146 FDREKTFLDNVLAPIVQDFPDLKIVLEHITTSDAVVFVKNANENVAATIT    195
                     ||||..|:::|:.|:.|....||:|.|||||.||..:|::.||.:|||||
PYRC_ECOLI       151 FDREARFIESVMEPLRQRLTALKVVFEHITTKDAADYVRDGNERLAATIT    200

PYRC_VIBVY       196 AHHLLYNRNHMLVGGIKPHFYCLPILKRNTHQLALISAATSGNKKFFLGT    245
                     ..||::|||||||||::||.|||||||||.||.||.....||..:.||||
PYRC_ECOLI       201 PQHLMFNRNHMLVGGVRPHLYCLPILKRNIHQQALRELVASGFNRVFLGT    250

PYRC_VIBVY       246 DSAPHAKGAKESACGCAGSYTAHAALELYAEVFEQAGKLENLEAFASHNG    295
                     ||||||:..|||:|||||.:.|..||..||.|||:...|::.|||.|.||
PYRC_ECOLI       251 DSAPHARHRKESSCGCAGCFNAPTALGSYATVFEEMNALQHFEAFCSVNG    300

PYRC_VIBVY       296 PDFYGLPRNQDTITLVKDAWPVPASMPFGGDIVVPIRAGENMEWKVK-    342
                     |.|||||.|...|.||::...|..|:....|.:||..|||.:.|.|| 
PYRC_ECOLI       301 PQFYGLPVNDTFIELVREEQQVAESIALTDDTLVPFLAGETVRWSVKQ    348
		  


б)Локальное выравнивание в программе Water.
PYRC_VIBVY         4 LTITRPDDWHVHLRDGEVLADTVRDISRYNGRALIMPNTVPPVTTTEMAL     53
                     |.|.||||||:|||||::|...|...|...|||::|||..|||||.|.|:
PYRC_ECOLI         8 LKIRRPDDWHLHLRDGDMLKTVVPYTSEIYGRAIVMPNLAPPVTTVEAAV     57

PYRC_VIBVY        54 AYRDRI-QAHNQTEQFSPLMSLYLTDNTTADEVRKAKASGAVVAAKLYPA    102
                     |||.|| .|......|:|||:.||||:...:|:.:....|...|||||||
PYRC_ECOLI        58 AYRQRILDAVPAGHDFTPLMTCYLTDSLDPNELERGFNEGVFTAAKLYPA    107

PYRC_VIBVY       103 GATTNSDSGVTDVKKIYPVLQAMQEVGMLLLVHGEVTTHDVDIFDREKTF    152
                     .|||||..|||.:..|.|||:.|:::||.||||||||..|:||||||..|
PYRC_ECOLI       108 NATTNSSHGVTSIDAIMPVLERMEKIGMPLLVHGEVTHADIDIFDREARF    157

PYRC_VIBVY       153 LDNVLAPIVQDFPDLKIVLEHITTSDAVVFVKNANENVAATITAHHLLYN    202
                     :::|:.|:.|....||:|.|||||.||..:|::.||.:|||||..||::|
PYRC_ECOLI       158 IESVMEPLRQRLTALKVVFEHITTKDAADYVRDGNERLAATITPQHLMFN    207

PYRC_VIBVY       203 RNHMLVGGIKPHFYCLPILKRNTHQLALISAATSGNKKFFLGTDSAPHAK    252
                     ||||||||::||.|||||||||.||.||.....||..:.||||||||||:
PYRC_ECOLI       208 RNHMLVGGVRPHLYCLPILKRNIHQQALRELVASGFNRVFLGTDSAPHAR    257

PYRC_VIBVY       253 GAKESACGCAGSYTAHAALELYAEVFEQAGKLENLEAFASHNGPDFYGLP    302
                     ..|||:|||||.:.|..||..||.|||:...|::.|||.|.|||.|||||
PYRC_ECOLI       258 HRKESSCGCAGCFNAPTALGSYATVFEEMNALQHFEAFCSVNGPQFYGLP    307

PYRC_VIBVY       303 RNQDTITLVKDAWPVPASMPFGGDIVVPIRAGENMEWKVK    342
                     .|...|.||::...|..|:....|.:||..|||.:.|.||
PYRC_ECOLI       308 VNDTFIELVREEQQVAESIALTDDTLVPFLAGETVRWSVK    347



Выравнивания полученное спомощью Blast и Water оказались одинаковыми, только вес выравниваний отличается на 4. Так как и Water и Blast используют для подсчета веса одну и ту же матрицу, я считаю, что системы начисления штрафов за гэпы у Blast и Water отличаются.
Выравнивания, полученные спомощью Blast и Needle отличаются друг от друга, отличаются длины фрагментов выравнивания (в Blast - с 4 по 342 для PYRC_ECOLI и 8-347 для PYRC_VIBVY, в Needle же 1-342, 1-348 соответственно).

©Базылев Сергей, 2007