Необходимо провести итеративный поиск программой PSI-BLAST по банку Swiss-Prot для четырёх аминокислотных последовательностей: первые три с номерами доступа P18196, P0A832, P17265, а последняя - последовательность моего белка (GLOX_BACSU).
Поиск аминокислотных последовательностей с помощью программы PSI-BLAST требуется произвести по банку Swiss-Prot, используя значение 5000 для максимального количества отображаемых в результате последовательностей и стандартное значение для порога на E-value, равное 0,005.
ID белка | AC белка | Число итераций | Для первой итерации | Для последней итерации | ||||
Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | |||
MINC_ECOLI | P18196 | 5 | 165 | 0.004 | 0.005 | 995 | 7e-04 | 0.023 |
SSRP_ECOLI | P0A832 | 2 | 514 | 3e-12 | 4.9 | 514 | 3e-38 | 0.42 |
Y380_RHIME | P17265 | 4 | 15 | 7e-04 | 0.027 | 25 | 3e-18 | 0.024 |
GLOX_BACSU | O31616 | 4 | 176 | 0.005 | 0.009 | 2345 | 0.005 | 0.005 |
В первом случае разрыв E-value изменился незначительно (возможно это связано с тем, что если ничего не убирать, в итерациях появляется много новых "лишних" последовательностей, следовательно, есть неспецифичные участки, встречающиеся у многих белков и портящие матрицу).
Во втором белке разрыв сильно вырос (1-я итерация сошлась, следовательно, последовательность специфична)
В третьем случае разрыв также вырос. А вот в моем белке разрыв изменился весьма незначительно.
Теперь при e-value 0.001, если никакие последовательности не исключать, то поиск для последовательности P18196 стабилизировался после 2-ой итерации: e-value меньше, требования к находкам строже, следовательно, "случайные" последовательности в той или иной мере отсеиваются.