Необходимо провести итеративный поиск программой PSI-BLAST по банку Swiss-Prot для четырёх аминокислотных последовательностей: первые три с номерами доступа P18196, P0A832, P17265, а последняя - последовательность моего белка (GLOX_BACSU).

Поиск аминокислотных последовательностей с помощью программы PSI-BLAST требуется произвести по банку Swiss-Prot, используя значение 5000 для максимального количества отображаемых в результате последовательностей и стандартное значение для порога на E-value, равное 0,005.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5 165 0.004 0.005 995 7e-04 0.023
SSRP_ECOLI P0A832 2 514 3e-12 4.9 514 3e-38 0.42
Y380_RHIME P17265 4 15 7e-04 0.027 25 3e-18 0.024
GLOX_BACSU O31616 4 176 0.005 0.009 2345 0.005 0.005

В первом случае разрыв E-value изменился незначительно (возможно это связано с тем, что если ничего не убирать, в итерациях появляется много новых "лишних" последовательностей, следовательно, есть неспецифичные участки, встречающиеся у многих белков и портящие матрицу).

Во втором белке разрыв сильно вырос (1-я итерация сошлась, следовательно, последовательность специфична)

В третьем случае разрыв также вырос. А вот в моем белке разрыв изменился весьма незначительно.

Теперь при e-value 0.001, если никакие последовательности не исключать, то поиск для последовательности P18196 стабилизировался после 2-ой итерации: e-value меньше, требования к находкам строже, следовательно, "случайные" последовательности в той или иной мере отсеиваются.