PSI-BLAST

  1. Итеративный поиск по банку Swiss-Prot белков IDH_BACSU, P18196, P0A832 и P17265.

    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    IDH_BACSU P39126 7 354 0.002 0.025 513 4e-05 1.0
    MINC_ECOLI P18196 7 162 0.005 0.005 881 0.005 0.005
    SSRP_ECOLI P0A832 2 514 3e-10 5.4 514 5e-31 0.35
    RP5M_RHIME P17265 4 15 0.005 0.12 25 8e-15 0.025

    В случае MINC_ECOLI "расходится" - даже после 7ой итерации список не стабилизировался. В 6ой и 7ой итерации разрыв между E-value самой хушей из находок выше порога и лучшей - ниже порога, стал равен нулю (E-value=0.005). Изменения E-value у самой лучшей находки и "средней":

    P181196.1 A0KK57.1
    4e-134 4e-38
    1e-94 1e-67
    1e-80 2e-62
    3e-102 5e-80
    3e-81 2e-64
    6e-77 9e-59
    2e-73 9e-59
      Видно, что у лучшей находки E-value повышается, у средней - понижается. Это обусловлено тем, что последующий поиск происходит уже не по   последовательности белка, а по профилю, созданному при предыдущем поиске. После первой итерации белок выравнивается с собственной   последовательностью, а после второй – уже с профилем. Поэтому наибольший скачок E-value наблюдается во время второй итерации.












  2. Повторный поиски с повышением порога до 0.001 был проведен для MINC_ECOLI:

    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,001) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,001) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 3 115 0.001 0.001 188 3e-10 0.001


    Из таблицы видно, что ужесточение порога можно использовать для более эффективного поиска.

© Anastasia Maslova, 2010