BLAST

Задание 1
  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка
Accession P37551 1O57 1O57
E-value 8e-164 3e-165 1e-162
Вес (в битах) 575 576 576
Процент идентичности 100 % 100 % 100 %
Найдены ли другие белки с теми же значениями E-value и веса в битах?
Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID)
нет нет Найдены 4 одинаковые цепи (A, B, C, D). Например, 1O57 B.
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
74 4 484
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 702 21 3020
Accession Q59040 1ORO XP_003132672
E-value 0.96 0.86 0.99
Вес (в битах) 34.3 30.4 38.5
% идентичности 26 % 24 % 26 %
% сходства 48 % 41 % 44 %
Длина выравнивания 131 123 162
Координаты выравнивания (от-до, в запросе и в находке) Query: от 130 до 260
Subject: от 93 до 211
Query: от 115 до 229
Subject: от 46 до 150
Query: от 102 до 259
Subject: от 37 до 181
Число гэпов 12/131 (9%) 26/123 (21%) 21/162 (13%)


a) Во всех трех БД мне удалось найти свой белок P37551, только в PDB и nr он записан под другим идентификатором - 1O57 (из заданий первого семестра я знаю, что это именно его идентификатор). Также удалось найти структуру белка в PDB.
b) Число явных гомологов, представленных тремя БД, сильно различается. На мой взгляд, это может быть обусловлено разницей в размерах этих трех БД. В PDB нашлось всего 4 гомолога, т.к. далеко не у всех белков выявлена структура; в nr нашлось так много гомологов - 484, потому что он включает в себя все белковые последовательности из всевозможных источников (в первую очередь Swiss-Prot и аннотации кодирующих участков генов в GenBank).
c) PDB- 31 находка (лимитировано E-value, я же в графе Max target sequences задала значение 1000), SwissProt - 837 находок (ограничено E-value, заданное мной значение равно 1000), nr - 3638 находок (ограничено E-value, заданное мной значение равно 5000). Пороговое значение E-value = 10 по умолчанию.

Задание 2

Лучший гомолог белка PURR_BACSU - белок APT_MUSPA из организма Mus pahari (Gairdner's shrew-mouse) (царство Eukaryota).
Номер находки в списке описаний 1
Accession P47956
E-value 1e-05
Вес (в битах) 49.7
% идентичности 29 %
% сходства 50 %
Длина выравнивания 108
Координаты выравнивания (от-до, в запросе и в находке) Query: от 130 до 234
Subject: от 57 до 158
Число гэпов 3/105 (3%)


Задание 3

Выравнивание, созданное программой BLAST
Query  130  EIDVVMTVATKGIPLAYAAASYLNVPVVIVRKDNKVTEGSTVSINYVSGSSNRIQTMSLA  189
            +ID +  + ++G     + A  L V  V++RK  K+  G T+S +Y          + + 
Sbjct  57   KIDYIAGLDSRGFLFGPSLAQELGVGCVLIRKQGKLP-GPTISASYALEYGK--AELEIQ  113

Query  190  KRSMKTGSNVLIIDDFMKAGGTINGMINLLDEFNANVAGIGVLVE  234
            K +++ G  V+I+DD +  GGT+    +LL +  A V     LVE
Sbjct  114  KDALEPGQRVVIVDDLLATGGTMFAACDLLHQLRAEVVECVSLVE  158
Length=180
Identities = 30/105 (29%)
Positives (Similarity) = 52/105 (50%)
Gaps = 3/105 (3%)
Score = 49.7
a)Оптимальное частичное выравнивание, полученное программой water

PURR_BACSU       130 EIDVVMTVATKGIPLAYAAASYLNVPVVIVRKDNKVTEGSTVSINYVSGS    179
                     :||.:..:.::|.....:.|..|.|..|::||..|: .|.|:|.:|....
APT_MUSPA         57 KIDYIAGLDSRGFLFGPSLAQELGVGCVLIRKQGKL-PGPTISASYALEY    105

PURR_BACSU       180 SNRIQTMSLAKRSMKTGSNVLIIDDFMKAGGTINGMINLLDEFNANVAGI    229
                     ..  ..:.:.|.:::.|..|:|:||.:..|||:....:||.:..|.|...
APT_MUSPA        106 GK--AELEIQKDALEPGQRVVIVDDLLATGGTMFAACDLLHQLRAEVVEC    153

PURR_BACSU       230 GVLVEAEGVDER    241
                     ..|||...:..|
APT_MUSPA        154 VSLVELTSLKGR    165



Length: 112
Identity: 31/112 (27.7%)
Similarity: 54/112 (48.2%)
Gaps: 3/112 ( 2.7%)
Score: 113.0


b) Оптимальное полное выравнивание, выполненное программой needle

PURR_BACSU         1 MKFRRSGRLVDLTNYLLTHPHELIPLTFFSERYESAKSSISEDLTIIKQT     50
                                                                       
APT_MUSPA          0 --------------------------------------------------      0

PURR_BACSU        51 FEQQGIGTLLTVPGAAGGVKYIPKMKQAEAEEFVQTLGQSLANPERILPG    100
                                             |.::|.:...:.:   .:.|:..:||
APT_MUSPA          1 ------------------------MSESELKLVARRI---RSFPDFPIPG     23

PURR_BACSU       101 G-YVYLTDILGKPSVLSKVGKLFASVFAER---EIDVVMTVATKGIPLAY    146
                     . :..::.:|..|.......:|.||.....   :||.:..:.::|.....
APT_MUSPA         24 VLFRDISPLLKDPDSFRASIRLLASHLKSTHSGKIDYIAGLDSRGFLFGP     73

PURR_BACSU       147 AAASYLNVPVVIVRKDNKVTEGSTVSINYVSGSSNRIQTMSLAKRSMKTG    196
                     :.|..|.|..|::||..|: .|.|:|.:|......  ..:.:.|.:::.|
APT_MUSPA         74 SLAQELGVGCVLIRKQGKL-PGPTISASYALEYGK--AELEIQKDALEPG    120

PURR_BACSU       197 SNVLIIDDFMKAGGTINGMINLLDEFNANVAGIGVLVEAEGVD--ERLVD    244
                     ..|:|:||.:..|||:....:||.:..|.|.....|||...:.  |||..
APT_MUSPA        121 QRVVIVDDLLATGGTMFAACDLLHQLRAEVVECVSLVELTSLKGRERLGP    170

PURR_BACSU       245 -EYMSLLTLSTINMKEKSIEIQNGNFLRFFKDNLLKNGETES    285
                      .:.|||...                                
APT_MUSPA        171 IPFFSLLQYD--------------------------------    180


Length: 292
Identity: 46/292 (15.8%)
Similarity: 83/292 (28.4%)
Gaps: 119/292 (40.8%)
Score: 102.0

Во всех выравниваниях использовалась матрица BLOSUM62, штраф за открытие гэпа: 11, за его удлиннение: 1.
Частичные выравнивания, полученные с помощью BLAST и water, очень сходны между собой, хотя вес выр. water более чем в 2 раза превышает вес выр. Blast. Есть маленькие различия: напротив 167 остатка Е в выр. Blast стоит гэп, а выр. water гэп сдвинут на 1 остаток влево относительно этой позиции. Также в выр. water 241-й R 1-го белка выровнен с 165-м R 2-го белка. Если сравнить выравнивания, полученные с помощью BLAST (частичное) и needle (полное), можно заметить, что в участке последовательности, выровненном BLASTом, так же, как и в предыдущем сравнении, напротив 167 остатка Е в выр. Blast стоит гэп, а выр. needle гэп сдвинут на 1 остаток влево относительно этой позиции. Конечно, в needle есть еще и выравнивания начального и конечного участков белков. Вес выр. needle также более чем в 2 раза превышает вес выр. Blast.

выравнивание в stretcher
выравнивание в matcher

Задание 3

1) При изменении матрицы BLOSUM62 на матрицу BLOSUM80 получено 657 находок - потенциальных гомологов белка (вместо 702), причем худшая из удовлетворительных находок имеет E-value = 0.98 (вместо прежних 0.96). Вес выравниваний изменился.
2)При замене штрафов за гэпы с 11-1 на 12-1 получено 688 находок (вместо 702), худшая из удовлетворительных имеет E-value = 0.99 (вместо прежних 0.96). Вес выравниваний также изменился.


E-mail: yan1303@yandex.ru
Официальный сайт ФББ
Ваши предложения :)))
Проекты
Главная страница



©Шарапова Яна