Главная | Проекты | Семестры |
- Результаты поиска гомологов белков с помощью PSI-BLAST:
ID белка AC белка Число итераций Для первой итерации Для последней итерации Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога MINC_ECOLI P18196 5 (не сходится) 126 0.004 0.005 239 0.003 0.007 SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 3e-10 5.0 NUSB_ECOLI P0A780 4 327 0.003 0.008 388 5e-07 0.017 GLUQ_ECOLI P27305 5 (не сходится) 802 0.004 0.006 3556 0.005 0.005
В сошедшихся результатах разница между худшим E-value выше порога и лучшим E-value ниже порога с каждой итерацией возрастает - т. е. все оставшиеся белки далеки от выбранных. Там же, где результаты не сошлись, эта разница часто остается маленькой, т. е. еще возможно найти белки, сходные с отобранными, поэтому и нет сходимости. Также поиск часто не сходится, если в какой-то момент над порогом проходит новая последовательность, которая "влечет" за собой много новых последовательностей, которые не подходили раньше. Так происходит, например, в случае MINC_ECOLI.Я так же проследила за e-value моего белка (GLUQ_ECOLI) и белка SYQ_NEIMA (чуть выше порога при первой итерации):
Как видно, за счет отбора e-value лучшей находки возрастает, а значение e-value средней находки резко уменьшилось после первой итерации, значительно приблизившись к значению e-value лучшей находки (т. к. после первой интерации BLAST стал сравнивать с множественным выравниванием, в котором учитывалась и средняя находка), а затем стало возрастать вместе с лучшей.
№ итерации GLUQ_ECOLI SYQ_NEIMA 1 2e-175 0.003 2 2e-134 3e-143 3 3e-112 1e-110 4 2e-102 1e-65 5 2e-71 5e-45 - При изменении порога на 0.001 поиск по первому белку сошелся уже со второй итерации. При уменьшении величины неподошедшего порога поиск не сходится. Для моего белка (GLUQ_ECOLI) поиск сходится при пороге 10-6.
PSI-BLAST ищет белки, подходящие к профилю, составленному по построеному при предыдущих итерациях множественному выравниванию. Каждый новый белок вносит поправки в это выравнивание, и на следующем этапе под него могут подойти еще новые белки. Меньший порог позволяет охватить все такие белки за несколько итераций (в т. ч. за 2), в то время как при большем пороге может пройти очередной белок, который, изменяя профиль, влечет за собой множество других белков. При уменьшении порога можно избежать попадания этого белка в список, и поиск завершится.