PSI-BLAST



1. Итеративный поиск программой PSI-BLAST по банку Swiss-Prot

Первые три последовательности: P18196, P0A832, P17265. Третья - это последовательность моего белка. Изменяем банк поиска на Swiss-Prot, программу на PSI-BLAST и значение параметра "Max target sequences" ставим на 5000. Выполняем до пяти итераций, пока появляются новые последовательности выше порога на E-value 0,005. Если после пятой итерации список не стабилизировался, останавливаемся.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
 MINC_ECOLI  P18196  6  165  0,004  0,005  995  9e-04  0.099
 SSRP_ECOLI  P0A832  2  514  3e-12  4.9  514  3e-38  0.42
 Y380_RHIME  P17265  4  15  7e-04  0.027  25  3e-18  0.024
 YDAF_BACSU  P96579  6  12  0.0002  0.007  437  0.004  0.007

P18196:
Число находок с каждой итерацией увеличивалось. Разрыв между значениями E-value у худшей находки выше порога и лучшей находки ниже порога то увеличивалось, то уменьшалось.
P0A832:
Число находок от итерации к итерации не изменялось, разрыв в значениях E-value увеличивался.
P17265:
Число находок сначала увеличилось, а потом не изменялось. Разрыв в значениях e-value постоянно изменялся.
P96579:
Число находок все время увеличивалось. Разрыв в значениях E-value сначала увеличился, потом не изменялся. Список и после пятой итерации "не сошелся".
2.

Поиск для последовательностей, число интераций которых больше 5

Порог ставим на 0,001.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
 MINC_ECOLI  P18196  3  157  0,001  0,001  188  4e-12  0,001
 YDAF_BACSU  P96579  6  12  2e-04  0,007  429  5e-04  0,002

При понижении порогового значения исключаются некоторые последовательности с большим значением E-value, поэтому список "сходится" быстрее. На третьей итерации список для MINC_ECOLI "сошелся". Для YDAF_BACSU список не стабилизировался после шестой итерации.