Учебный сайт Смирновой Виктории

Главная Проекты Семестры


PSI-BLAST


  1. Результаты поиска гомологов белков с помощью PSI-BLAST:
    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 5 (не сходится) 126 0.004 0.005 239 0.003 0.007
    SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 3e-10 5.0
    NUSB_ECOLI P0A780 4 327 0.003 0.008 388 5e-07 0.017
    GLUQ_ECOLI P27305 5 (не сходится) 802 0.004 0.006 3556 0.005 0.005

    В сошедшихся результатах разница между худшим E-value выше порога и лучшим E-value ниже порога с каждой итерацией возрастает - т. е. все оставшиеся белки далеки от выбранных. Там же, где результаты не сошлись, эта разница часто остается маленькой, т. е. еще возможно найти белки, сходные с отобранными, поэтому и нет сходимости. Также поиск часто не сходится, если в какой-то момент над порогом проходит новая последовательность, которая "влечет" за собой много новых последовательностей, которые не подходили раньше. Так происходит, например, в случае MINC_ECOLI.

    Я так же проследила за e-value моего белка (GLUQ_ECOLI) и белка SYQ_NEIMA (чуть выше порога при первой итерации):
    № итерации GLUQ_ECOLI SYQ_NEIMA
    1 2e-175 0.003
    2 2e-134 3e-143
    3 3e-112 1e-110
    4 2e-102 1e-65
    5 2e-71 5e-45
    Как видно, за счет отбора e-value лучшей находки возрастает, а значение e-value средней находки резко уменьшилось после первой итерации, значительно приблизившись к значению e-value лучшей находки (т. к. после первой интерации BLAST стал сравнивать с множественным выравниванием, в котором учитывалась и средняя находка), а затем стало возрастать вместе с лучшей.

  2.   При изменении порога на 0.001 поиск по первому белку сошелся уже со второй итерации. При уменьшении величины неподошедшего порога поиск не сходится. Для моего белка (GLUQ_ECOLI) поиск сходится при пороге 10-6.
    PSI-BLAST ищет белки, подходящие к профилю, составленному по построеному при предыдущих итерациях множественному выравниванию. Каждый новый белок вносит поправки в это выравнивание, и на следующем этапе под него могут подойти еще новые белки. Меньший порог позволяет охватить все такие белки за несколько итераций (в т. ч. за 2), в то время как при большем пороге может пройти очередной белок, который, изменяя профиль, влечет за собой множество других белков. При уменьшении порога можно избежать попадания этого белка в список, и поиск завершится.


© Smirnova Victoriya, 2008