PSI_BLAST


1)Проведите работу с четырьмя аминокислотными последовательностями. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P0A780; четвёртая – последовательность моего белка RBSB_ECOLI (P02925).. Для этих последовательностей провела итеративный поиск по банку Swiss-Prot программой PSI-BLAST. При поиске всем параметрам (кроме банка поиска и программы) оставила значения по умолчанию. Выполняла до пяти итераций, пока появляются новые последовательности выше порога 0,005 на E-value; если же и после пятой итерации список не стабилизировался, на этом останавливалась. Результаты занесла в таблицу:
ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5 124 0.005 0.005 239 0.003 0.007
SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 8e-31 0.62
NUSB_ECOLI P0A780 4 327 0.003 0.008 388 2e-12 0.031
RBSB_ECOLI P02925 5 108 0.004 0.008 174 0.002 0.006

Для последовательности MING_ECOLI итерации не сошлись после пяти итераций. С таким порогом (0.005) PSI-BLAST не отделил от доугих белков белки, похожие на исходный.

Для последовательности (SSRP_ECOLI) сошлась вторая итерация, то есть список белков, попавших в него в результате первой итерации, не поменялся (изменились лишь E-value белков в списке).

Для последовательности (NUSB_ECOLI) итерация тоже сошлась, но лишь четвертая.

Для последовательности (моего белка RBSB_ECOLI), как и в самом первом случае, сходящейся итерации не нашлось. Причем, в этом случае ситуация вхождения в список лишнего белка не так очевидна, как в первом случае.

E-value самой лучшей находки после первой итерации в результате последующих итераций падает,т.к. поиск ведется с каждым разом по более мягким критериям (в результате множественных выравниваний). Находится большее количество последовательностей.
E-value среднего белка в списке (ближе к порогу) при последовательных итерациях будет все меньше, т.е. "лучше" (с каждым разом этот белок будет все лучше подходить под критерий на основании множественного выравнивания.

О "разрыве" между значениями E-value у худшей находки выше порога и лучшей – ниже порога:
В последующих итерациях он становится больше, чем в исходной, т.к. каждый раз выше порога (0.005) отделяются белки, наиболее схожие с исходным (с каждым разом этот белок будет все лучше подходить под критерий), и E-value становится "лучше", следовательно, увеличивается "разрыв".


2)Для той последовательности, для которой итерации "не сошлись" (MINC_ECOLI, RBSB_ECOLI), провела поиск снова, изменив порог с 0,005 на 0,001.

Для последовательности MINC_ECOLI с таким порогом третья итерация стала сходящейся. Т.к. в этот список не попал белок из др. семейства FRMA_PASPI, из-за которого при 0.005 произошло "размывание" списка.

Для последовательности RBSB_ECOLI с таким порогом только шестая итерация стала сходящейся. Т.к. в этот список не попал белок из др. семейства YKVZ_BACSU, из-за которого при 0.005 произошло "размывание" списка.
©Старовойтова Анна,2008