BLAST |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Задание 1
a) Во всех трех БД мне удалось найти свой белок P37551, только в PDB и nr он записан под другим идентификатором - 1O57 (из заданий первого семестра я знаю, что это именно его идентификатор). Также удалось найти структуру белка в PDB. b) Число явных гомологов, представленных тремя БД, сильно различается. На мой взгляд, это может быть обусловлено разницей в размерах этих трех БД. В PDB нашлось всего 4 гомолога, т.к. далеко не у всех белков выявлена структура; в nr нашлось так много гомологов - 484, потому что он включает в себя все белковые последовательности из всевозможных источников (в первую очередь Swiss-Prot и аннотации кодирующих участков генов в GenBank). c) PDB- 31 находка (лимитировано E-value, я же в графе Max target sequences задала значение 1000), SwissProt - 837 находок (ограничено E-value, заданное мной значение равно 1000), nr - 3638 находок (ограничено E-value, заданное мной значение равно 5000). Пороговое значение E-value = 10 по умолчанию. Задание 2 Лучший гомолог белка PURR_BACSU - белок APT_MUSPA из организма Mus pahari (Gairdner's shrew-mouse) (царство Eukaryota).
Задание 3 Выравнивание, созданное программой BLAST Query 130 EIDVVMTVATKGIPLAYAAASYLNVPVVIVRKDNKVTEGSTVSINYVSGSSNRIQTMSLA 189 +ID + + ++G + A L V V++RK K+ G T+S +Y + + Sbjct 57 KIDYIAGLDSRGFLFGPSLAQELGVGCVLIRKQGKLP-GPTISASYALEYGK--AELEIQ 113 Query 190 KRSMKTGSNVLIIDDFMKAGGTINGMINLLDEFNANVAGIGVLVE 234 K +++ G V+I+DD + GGT+ +LL + A V LVE Sbjct 114 KDALEPGQRVVIVDDLLATGGTMFAACDLLHQLRAEVVECVSLVE 158Length=180 Identities = 30/105 (29%) Positives (Similarity) = 52/105 (50%) Gaps = 3/105 (3%) Score = 49.7 a)Оптимальное частичное выравнивание, полученное программой water PURR_BACSU 130 EIDVVMTVATKGIPLAYAAASYLNVPVVIVRKDNKVTEGSTVSINYVSGS 179 :||.:..:.::|.....:.|..|.|..|::||..|: .|.|:|.:|.... APT_MUSPA 57 KIDYIAGLDSRGFLFGPSLAQELGVGCVLIRKQGKL-PGPTISASYALEY 105 PURR_BACSU 180 SNRIQTMSLAKRSMKTGSNVLIIDDFMKAGGTINGMINLLDEFNANVAGI 229 .. ..:.:.|.:::.|..|:|:||.:..|||:....:||.:..|.|... APT_MUSPA 106 GK--AELEIQKDALEPGQRVVIVDDLLATGGTMFAACDLLHQLRAEVVEC 153 PURR_BACSU 230 GVLVEAEGVDER 241 ..|||...:..| APT_MUSPA 154 VSLVELTSLKGR 165 Length: 112 Identity: 31/112 (27.7%) Similarity: 54/112 (48.2%) Gaps: 3/112 ( 2.7%) Score: 113.0 b) Оптимальное полное выравнивание, выполненное программой needle PURR_BACSU 1 MKFRRSGRLVDLTNYLLTHPHELIPLTFFSERYESAKSSISEDLTIIKQT 50 APT_MUSPA 0 -------------------------------------------------- 0 PURR_BACSU 51 FEQQGIGTLLTVPGAAGGVKYIPKMKQAEAEEFVQTLGQSLANPERILPG 100 |.::|.:...:.: .:.|:..:|| APT_MUSPA 1 ------------------------MSESELKLVARRI---RSFPDFPIPG 23 PURR_BACSU 101 G-YVYLTDILGKPSVLSKVGKLFASVFAER---EIDVVMTVATKGIPLAY 146 . :..::.:|..|.......:|.||..... :||.:..:.::|..... APT_MUSPA 24 VLFRDISPLLKDPDSFRASIRLLASHLKSTHSGKIDYIAGLDSRGFLFGP 73 PURR_BACSU 147 AAASYLNVPVVIVRKDNKVTEGSTVSINYVSGSSNRIQTMSLAKRSMKTG 196 :.|..|.|..|::||..|: .|.|:|.:|...... ..:.:.|.:::.| APT_MUSPA 74 SLAQELGVGCVLIRKQGKL-PGPTISASYALEYGK--AELEIQKDALEPG 120 PURR_BACSU 197 SNVLIIDDFMKAGGTINGMINLLDEFNANVAGIGVLVEAEGVD--ERLVD 244 ..|:|:||.:..|||:....:||.:..|.|.....|||...:. |||.. APT_MUSPA 121 QRVVIVDDLLATGGTMFAACDLLHQLRAEVVECVSLVELTSLKGRERLGP 170 PURR_BACSU 245 -EYMSLLTLSTINMKEKSIEIQNGNFLRFFKDNLLKNGETES 285 .:.|||... APT_MUSPA 171 IPFFSLLQYD-------------------------------- 180 Length: 292 Identity: 46/292 (15.8%) Similarity: 83/292 (28.4%) Gaps: 119/292 (40.8%) Score: 102.0 Во всех выравниваниях использовалась матрица BLOSUM62, штраф за открытие гэпа: 11, за его удлиннение: 1. Частичные выравнивания, полученные с помощью BLAST и water, очень сходны между собой, хотя вес выр. water более чем в 2 раза превышает вес выр. Blast. Есть маленькие различия: напротив 167 остатка Е в выр. Blast стоит гэп, а выр. water гэп сдвинут на 1 остаток влево относительно этой позиции. Также в выр. water 241-й R 1-го белка выровнен с 165-м R 2-го белка. Если сравнить выравнивания, полученные с помощью BLAST (частичное) и needle (полное), можно заметить, что в участке последовательности, выровненном BLASTом, так же, как и в предыдущем сравнении, напротив 167 остатка Е в выр. Blast стоит гэп, а выр. needle гэп сдвинут на 1 остаток влево относительно этой позиции. Конечно, в needle есть еще и выравнивания начального и конечного участков белков. Вес выр. needle также более чем в 2 раза превышает вес выр. Blast. выравнивание в stretcher выравнивание в matcher Задание 3 1) При изменении матрицы BLOSUM62 на матрицу BLOSUM80 получено 657 находок - потенциальных гомологов белка (вместо 702), причем худшая из удовлетворительных находок имеет E-value = 0.98 (вместо прежних 0.96). Вес выравниваний изменился. 2)При замене штрафов за гэпы с 11-1 на 12-1 получено 688 находок (вместо 702), худшая из удовлетворительных имеет E-value = 0.99 (вместо прежних 0.96). Вес выравниваний также изменился. |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||