PSI-BLAST



Окно BLAST
1.
ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5 (итерации не сошлись) 126 0.004 0.005 239 0.003 0.007
SSPP_ECOLI P0A832 2 449 3e-10 5 449 8e-31 0.62
NUSB_ECOLI P0A780 4 327 0.003 0.008 388 2e-12 0.031
AHPF_ECOLI P35340 5 (итерации не сошлись) 326 0.005 0.005 2180 0.005 0.005


Работа PSI-Blast идёт по принципу увеличения специфичности поиска за счёт генерации таблиц, на основе уже сделанной выборки. Таким образом, с каждой итерацией мы предъявляем системе новые требования
В случае с тремя последовательностями из примера, мы наблюдаем, что:

- в первом случае разрыв расширяется, но незначительно, и итерации не сходятся (программа не может обозначить границы между вероятными и маловероятными гомологами)
- во втором разрыв стремительно сокращается, но всё равно остаётся значительным и итерации сходятся очень быстро (программа уверенно выдаёт список вероятных гомологов)
- третий вариант - промежуточный: разрыв увеличивается, к четвёртой итерации программа перестаёт находить новые гомологи выше порога
Итерации не сошлись при поиске гомологов моего белка, более того, разрыв был ничтожен и не изменился.

При уменьшении порога до 0.001 (ужесточении требований) итерации в первом случае сходятся на третьей попытке. При увеличении хотя бы до 0.0015 - уже нет. Для моего белка сходимости нет и при пороге равном e-10, хотя после каждой итерации в списке появляются единичные последовательности (с первым белком, например, наблюдался "скачок" на 4й итерации).
С каждой итерацией e-value лучшей последовательности увеличивается, а последовательностей в конце списка уменьшается, они "мигрируют" в сторону середины списка.

К перечню исследовательских работ
На главную