Программа BLASTP

BLASTP
Главная
Назад

  1. Поиск гипотетических гомологов изучаемого белка в разных БД
  2. Таблица 1. Результаты поиска гипотетических гомологов белка psts_Ecoli

      Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
    1. Лучшая находка (в принципе должна соответствовать заданному белку)
    Идентификатор БД PSTS_ECOLI 2ABH NP_418184
    E-value 0.0 0.0 0.0
    Вес (в битах) 697 647 697
    % идентичности 100 100 100
    Найдены ли другие белки с теми же значениями E-value и веса в битах?
    Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID)
    не найдены не найдены с точно таким весом, но еще 9 с E-value=0.0(идентификатор psts_Ecoli, вес 643) не найдены с точно таким весом, но еще 25 с E-value=0.0(идентификатор YP_691097, вес 696)
    Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value<=1*10-10) 14 12 547
    2. "Худшая" находка (последняя в выдаче с E-value<=1.0)
    Номер находки в списке описаний (Descriptions) 27 16 879
    Идентификатор БД PHBP_HUMAN 2CAP YP_001785723
    E-value 0.095 0.012 0.99
    Вес (в битах) 37.7 36.6 38.5
    % идентичности 29 28 25
    % сходства 40 39 40
    Длина выравнивания 175 168 238
    Координаты выравнивания (номера первых и последних а.о.) 29-180 29-174 33-251
    % гэпов 21 22 18

    Краткий комментарий к таблице

  3. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
  4. Критерий: E-value<0.001, поиск в БД Swiss-Prot

    Поиск по таксону Homo sapiens не дал результатов

  5. Поиск белка по его фрагменту
  6. Таблица 2. Результаты поиска белка в Swiss-Prot по фрагменту последовательности

      Поиск по фрагменту Поиск по полной
    последовательности
    АС лучшей находки Q58421 Q58421
    E-value 4*10-18 0.0
    Вес (в битах) 88 788
    Найдены ли другие белки с теми же значениями E-value и веса в битах?
    нет нет

    Краткий комментарий
    Различия между результатами поиска по фрагменту последовательности и по полной последовательности заключаются, как можно заметить по данным из таблицы, в разнице E-value и веса, что основано на том, что фрагмент последовательности значительно короче самой последовательности, что делает невозможным даже при полном совпадении сказать, что это одна и та же последовательность или ее гомолог.

    В задании на странице Пробные выравнивания был дан фрагмент неизвестного белка. Теперь мы можем с помощью поиска по Swiss-Prot определить последовательность белка и сам белок.
    В результате определили, что фрагмент взят из белка PSTS_METJA (идентификатор PSTS_METJA, код доступа Q58421), его последовательность в fasta-формате.

    Выравнивание PSTS_ECOLI с PSTS_METJA

    PSTS_ECOLI  33   GATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANTVDFGASDAPLSD---EK  88
                     GATFP     KW + YQK   N K+ Y+G GS  G +       D G +D P+ +   +K
    PSTS_METJA  58   GATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGLTDIGRTDPPVKESMWKK  117
    
    PSTS_ECOLI  89   LAQEG--LFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLGDIYLGKIKKWDDEAIAKLNP  146
                         G    QFP ++G VV+  NIP +    L L    L DI+LGKI+ WDDE I K+NP
    PSTS_METJA  118  FLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLKLSRDVLADIFLGKIEYWDDERIKKINP  177
    
    PSTS_ECOLI  147  GL--KLPSQNIAVVRRADGSGTSFVFTSYLAKVNEEWKNNVGTGSTVKWPI-----GLGG  199
                      +  KLP + I VV R+D SGT+ +FT+YL+ +++EW   VG G TV WP      G+ G
    PSTS_METJA  178  EIADKLPHEKIIVVHRSDASGTTAIFTTYLSLISKEWAEKVGAGKTVNWPTDNIGRGVAG  237
    
    PSTS_ECOLI  200  KGNDGIAAFVQRLPGAIGYVEYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS  259
                     KGN G+ A V+  P  + Y E +YA +  L    L + +GK V PT+E    A      S
    PSTS_METJA  238  KGNPGVVAIVKSTPYTVAYTELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKAS  297
    
    PSTS_ECOLI  260  -----KTFAQDL---TNQKGEDAWPITSTTFILIHKDQK----KPEQGTEVLKFFDWAYK  307
                          + + +DL    +  G++A+PI + T +L+ +++      PE+   +  F  W   
    PSTS_METJA  298  IPNPTEGYKEDLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKDFLTWVLT  357
    
    PSTS_ECOLI  308  TGAKQANDLD-YASLPDSV  325
                      G K  +    Y  LP+ V
    PSTS_METJA  358  EGQKPEHLAPGYVGLPEDV  376
    
    
    
    В прошлом задании с помощью GeneDoc были сравнены фрагменты 218-245 белка PSTS_METJA и фрагмент 185-209 белка PSTS_ECOLI. Это выравнивание совпало с одним из сделанных мною выравниваний, точнее со вторым. Отсюда можно сделать вывод, что несмотря на одинаковый вес выравнивание то лучше, где открытий гэпов меньше.

  7. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
  8. Для получения выравниваний воспользуемся программами: Stretcher для получения глобального выравнивания, matcher - локального выравнивания. Параметры выравниваний: штраф за открытие гэпа 11, за продолжение - 1.

    Оптимальное глобальное выравнивание

                            10        20
    PSTS_E MK---------VMRTTVATVVAATLSMSAFSVF----------------A
           :           ..  .: ..   : .   :.                 .
    PSTS_M MNDTTQPTKGDAVKKILALILGLCLIVPVISIAGCVGGGNSQPSNNEKPS
                   10        20        30        40        50
    
              30        40        50         60        70
    PSTS_E EASLTGAGATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANT
              .   :::::     :: . :::   : :. :.: ::  : .
    PSTS_M TIIIRTTGATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGL
                   60        70        80        90       100
    
               80           90         100       110
    PSTS_E VDFGASDAPLSD---EKLAQEG--LFQFPTVIGGVVLAVNIPGLKSGELV
            : : .: :. .   .:    :    ::: ..: ::.  ::: .    :
    PSTS_M TDIGRTDPPVKESMWKKFLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLK
                  110       120       130       140       150
    
         120       130       140         150       160
    PSTS_E LDGKTLGDIYLGKIKKWDDEAIAKLNPGL--KLPSQNIAVVRRADGSGTS
           :    : ::.::::. :::: : :.:: .  ::: . : :: :.: :::.
    PSTS_M LSRDVLADIFLGKIEYWDDERIKKINPEIADKLPHEKIIVVHRSDASGTT
                  160       170       180       190       200
    
           170       180       190            200       210
    PSTS_E FVFTSYLAKVNEEWKNNVGTGSTVKWPI-----GLGGKGNDGIAAFVQRL
            .::.::. ...::   :: : :: ::      :. :::: :. : :.
    PSTS_M AIFTTYLSLISKEWAEKVGAGKTVNWPTDNIGRGVAGKGNPGVVAIVKST
                  210       220       230       240       250
    
                220       230       240       250
    PSTS_E PGAIGYVEYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS---
           :  . : : .:: .  :    : . .:: : ::.:    :      :
    PSTS_M PYTVAYTELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKASIPN
                  260       270       280       290       300
    
           260          270       280       290           300
    PSTS_E --KTFAQDLTNQ---KGEDAWPITSTTFILIHKDQK----KPEQGTEVLK
             . . .::       :..:.:: . : .:. ...      ::.   .
    PSTS_M PTEGYKEDLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKD
                  310       320       330       340       350
    
                  310        320       330       340
    PSTS_E FFDWAYKTGAKQANDLD-YASLPDSVVEQVRAAWKTNIKDSSGKPLY
           :  :    : :  .    :  ::. : . .       ::.
    PSTS_M FLTWVLTEGQKPEHLAPGYVGLPEDVAK-IGLNAVNMIKE-------
                  360       370        380
    

    Оптимальное локальное выравнивание

                 40        50         60        70        80
    PSTS_E GATFPAPVYAKWADTYQKETGN-KVNYQGIGSSGGVKQIIANTVDFGASD
           :::::     :: . :::   : :. :.: ::  : .       : : .:
    PSTS_M GATFPKYQIQKWIEDYQKTHPNVKIEYEGGGSGYGQEAFAKGLTDIGRTD
            60        70        80        90       100
    
                     90         100       110       120
    PSTS_E APLSD---EKLAQEG--LFQFPTVIGGVVLAVNIPGLKSGELVLDGKTLG
            :. .   .:    :    ::: ..: ::.  ::: .    : :    :
    PSTS_M PPVKESMWKKFLSTGDQPLQFPEIVGAVVVTYNIPEIGDKTLKLSRDVLA
           110       120       130       140       150
    
            130       140         150       160       170
    PSTS_E DIYLGKIKKWDDEAIAKLNPGL--KLPSQNIAVVRRADGSGTSFVFTSYL
           ::.::::. :::: : :.:: .  ::: . : :: :.: :::. .::.::
    PSTS_M DIFLGKIEYWDDERIKKINPEIADKLPHEKIIVVHRSDASGTTAIFTTYL
           160       170       180       190       200
    
              180       190            200       210
    PSTS_E AKVNEEWKNNVGTGSTVKWPI-----GLGGKGNDGIAAFVQRLPGAIGYV
           . ...::   :: : :: ::      :. :::: :. : :.  :  . :
    PSTS_M SLISKEWAEKVGAGKTVNWPTDNIGRGVAGKGNPGVVAIVKSTPYTVAYT
           210       220       230       240       250
    
         220       230       240       250            260
    PSTS_E EYAYAKQNNLAYTKLISADGKPVSPTEENFANAAKGADWS-----KTFAQ
           : .:: .  :    : . .:: : ::.:    :      :     . . .
    PSTS_M ELSYAIEQKLPVAALENKNGKFVKPTDETIKAAVSAVKASIPNPTEGYKE
           260       270       280       290       300
    
                 270       280       290           300
    PSTS_E DLTNQ---KGEDAWPITSTTFILIHKDQK----KPEQGTEVLKFFDWAYK
           ::       :..:.:: . : .:. ...      ::.   .  :  :
    PSTS_M DLKQMLDAPGDNAYPIVAFTHLLVWENKNGKHYSPEKAKAIKDFLTWVLT
           310       320       330       340       350
    
           310        320
    PSTS_E TGAKQANDLD-YASLPDSVVE
            : :  .    :  ::. : .
    PSTS_M EGQKPEHLAPGYVGLPEDVAK
           360       370
    

    Таблица 3. Результаты сравнения выравниваний последовательностей белков PSTS_ECOLI и PSTS_METJA

      Выравнивание, выданное BLASTP Оптимальное глобальное выравнивание, Stretcher Оптимальное локальное выравнивание, Matcher
    Вес 431 431 487
    Длина 319 397 321
    Идентичность, % 35 30.2 35.5
    Сходство, % 51 45.8 51.4

    Результаты выравниваний очень похожи, несмотря на такое различие, показанное в таблице.


© Ксения Лежнина 2008