PSI-BLAST


Задание 1.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 7 161 0.004 0.005 898 4e-04 0.015
SSRP_ECOLI P0A832 2 514 3e-10 5.6 514 5e-31 0.36
RP5M_RHIME P17265 4 14 0.001 0.005 25 9e-15 0.14
RNPH­_BACSU P28619 3 848 0.004 0.005 1052 2e-04 0.97

Выводы: итерации PSI-BLAST для этих последовательностей ведут себя по-разному :
1)при каждой из 6 интераций для первой последовательности число находок увеличивается ( очень странно, но если вбить E-value=0.005 вручную , то число находок стабилизируется уже после 3ей интерации).
2)число находок стабилизировалось уже при второй интерации
3) число находок стабилизировалось при 4 интерации
4) число находок стабилизировалось при 3 интерации
Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога во всех случаях увеличивается, при чем в первом и последнем случае незначительно, а во втором и третьем -резко.
Если проследить за изменением E-value лучшей находки для последовательности моего белка , то оно будет расти . А если посмотреть на изменение E-value находки из середины , то оно будет падать, что означает , что данная находкас каждой интерацией все больше и больше соответствует запросу ( т.к. сначала программа ищет последовательности близкие к исходной , а потом уже ищет последовательности подходящие под составленный ею "паттерн" на основе найденных послеовательностей.)

Задание 2.

На 3-ей итерации стабилизировался список , потому что мы повысили порог и , вероятно, таким образом убрали " нехорошую" последовательность, которая тащила за собой остальные.

   

© Алиса Муравьева. Все права защищены.