Главная

PSI-BLAST


Упражнение 1

Провела итеративный поиск программой PSI-BLAST по банку Swiss-Prot для четырёх аминокислотных последовательностей. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P17265; четвёртая – последовательность моего белка (DACC_BACSU).
При поиске, кроме банка поиска (Swiss-Prot) и программы (PSI-BLAST), изменила ещё значение параметра "Max target sequences" с 500 на 5000, остальным параметрам оставила значения по умолчанию. Выполнила до пяти итераций, пока появлялись новые последовательности выше порога на E-value 0,005 (для той последовательности, для которой список не стабилизировался после пятой итерации, провела поиск снова, изменив порог с 0,005 на 0,001).
Заполнила таблицу:
ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5 165 0.004 0.005 995 7e-04 0.023
SSRP_ECOLI P0A832 2 514 3e-12 4.9 514 3e-38 0.42
Y380_RHIME P17265 3 15 7e-04 0.027 24 8e-19 0.002
DACC_BACSU P39844 2 5 7e-15 1.2 5 1e-133 0.045

Краткие выводы:

1)(P18196)

Число находок после каждой интерации увеличивается (первая – 165, вторая- 190, третья-204, четвертая -453 , пятая - 995.
Разрыв между значениями E-value худшей находки выше порога и лучшей находки ниже порога сначала увеличивается ( у первой: 0,005 -0,004; у второй: 0,005 – 0,066; у третьей: 0,004 – 0,006; у четвертой: 0,005-0,005; у пятой: 7e-04 - 0.023 ).
E-value лучшей находки увеличивается: у первой: 8e-171; у второй: 1e-117; у третьей: 1e-100; у четвертой: 6e-97; у пятой: 1e-83.
E-value "средней" находки уменьшается(например, Q5KWN7.1) у 1-ой: 0.002; у 2-ой: 5e-28;у 3-ей: 2e-47;у 4-ой: 1e-51; у 5-ой: 5e-42.
После пятой итерации список не стабилизировался, поэтому провела поиск снова, изменив порог с 0,005 на 0,001.
Теперь список стабилизировался на второй интерации.
На первой итерации 157 находок выше порога (у худшой из которых E-value равно 0.001).
У лучшей находки ниже порога значение 0.001.
На второй итерации 188 находок выше порога (у худшой из которых E-value равно 8e-08).
У лучшей находки ниже порога значение 0.003.
На третьей итерации число находок выше порога не изменилось (у худшой из которых E-value равно 4e-12).
У лучшей находки ниже порога значение 0.001.


2)(P0A832)

Число находок после каждой интерации не изменяется (514).
Разрыв между значениями E-value худшей находки выше порога и лучшей находки ниже порога (у первой: 3e-12 – 4,9; у второй: 3e-38 - 0.42).
E-value лучшей находки увеличивается: у первой: 3e-116; у второй: 2e-94 (белок переместился на вторую позицию).
E-value "средней" находки уменьшается (Q601U1.1) у первой - 3e-17, у второй - 2e-47.
После выполнения двух итераций список стабилизировался. На второй итерации не было найдено новых последовательностей выше заданного порога.


3) (P17265)

Число находок после каждой интерации увеличивается (первая – 15, вторая- 24, третья-24.
Разрыв между значениями E-value худшей находки выше порога и лучшей находки ниже порога (у первой: 7e-04 - 0.027; у второй: 5e-09 – 0.011; у третьей: 8e-19 – 0.002).
E-value лучшей находки: у первой: 7e-141; у второй: 1e-77; у третьей: 2e-75.
E-value "средней" находки уменьшается (например, Q49VV1.1) у 1-ой: 1e-05; у 2-ой: 3e-61;у 3-ей: 3e-6).
После выполнения трёх итераций список стабилизировался.


4) (P39844)

Число находок после каждой интерации не изменяется (первая –5 , вторая-5 ).
Разрыв между значениями E-value худшей находки выше порога и лучшей находки ниже порога увеличивается ( у первой: 7e-15 - 1.2; у второй: 1e-133 - 0.045).
E-value лучшей находки не изменяется: у первой: 0.0; у второй: 0.0.
E-value "средней" находки уменьшается(например, P45161.1) у 1-ой: 1e-31; у 2-ой: 5e-177.
Уже после выполнения второй интерации не было найдено новых значений выше заданного порога, то есть список стабилизировался.
©Eliseeva Julia