1. Итеративный поиск программой PSI-BLAST аминокислотных последовательностей.
Был проведен поиск программой PSI-BLAST по банку Swiss-Prot для следующих последовательностей:
ID белка | AC белка | Число итераций | Для первой итерации | Для последней итерации | ||||
Число находок выше порога (0.005) | Худшее E-value выше порога | Лучшее E-value ниже порога | Число находок выше порога (0.005) | Худшее E-value выше порога | Лучшее E-value ниже порога | |||
MINC_ECOLI | P18196 | 5 | 32 | 0.005 | 0.006 | 886 | 2e-05 | 0.15 |
SSRP_ECOLI | P0A832 | 2 | 514 | 3e-10 | 5.6 | 514 | 5e-31 | 0.36 |
RP5M_RHIME | P17265 | 4 | 14 | 0.001 | 0.005 | 25 | 9e-15 | 0.14 |
PTHP_BACSU | P08877 | 71 | 3 | 4e-4 | 0.03 | 76 | 4e-15 | 0.29 |
C каждой итерацией число находок либо увеличивается, либо остается неизменным. E-value лучших находок (выше порога) уменьшается, а худших (ниже порога) - увеличивается. В случае первого белка из списка (MINC_ECOLI) список выровнять так и не удалось даже после 5ой итерации. Поэтому число находок возросло так значительно.
2. Уменьшение порога PSI-BLAST.
C целью выравнивания списка для белка MINC_ECOLI порог PSI-BLAST был уменьшен до 0.001. И уже после 3ей итерации список был выровнен до 188 пунктов (E-value min = 3e-10). Ранее поиск не сходился, потому что скорее всего на одной из итераций был найден белок с 0.001 < E-value < 0.005, который "заставлял" программу находить лишние последовательности.