ID белка | AC белка | Число итераций | Для первой итерации | Для последней итерации | ||||
Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | |||
P18196 | P18196, GI:127096 | 4 | 162 | 0,005 | 0,005 | 604 | 0,005 | 0,005 |
Комментарий | После второй итерации на самой границе допустимых значений появляется 1 белок с другой функцией (Protein translocase subunit secA, AC:A7H8E6.1), который тащит за собой своих гомологов - получается смесь, которая тянет за собой еще... Расходится Но, у этого белка e-value == 0,003, в то время, как следующий гомолог имеет e-value порядка 10-7. Если этот лишний белок исключить из следующей итерации, то набор тут же сходится - будет найден только один новый, явно посторонний белок (e-value == 0,002, в то время, как у следующего - уже порядка 10-10). Того же эффекта можно добиться, установив пороговое значение e-value на 0,001 (для 0,002 появляется посторонний белок на 3-ей итерации) |
|||||||
P0A832 | P0A832, GI:67472569 | 2 | 514 | 3*10-10 | 5,4 | 514 | 5*10-31 | 0,35 |
Комментарий | Сразу все с такой же функцией идут с очень низким e-value, а еще всего три оставшихся - имеют другие функции и большой (>5) e-value. Ничего нового psi не находит (только несколько белков, которые он сам не считает гомологами из-за слишком большого e-value). А e-value гомологов уменьшается с каждой итерацией | |||||||
P17265 | P17265 | 4 | 15 | 0,005 | 0,12 | 25 | 8*10-15 | 0,025 |
Комментарий | Почти все найденные BlastP гомологи - белки с неопределенной и даже не предположенной функцией. После второй итерации e-value худших гомологов порядка 10-7. После 3 итерации - всего 1 новый белок. Хотя его e-value и довольно велико, после 4 итерации - e-value резко падает и новых белков он за собой не тянет | |||||||
P39594 | P39594, GI:732341 | 3 | 296 | 0,003 | 0,007 | 1086 | 0,005 | 0,005 |
Комментарий | Мой белок - расходится. Но, выбросив би- и много-функциональные белки из сравнения, я добился "практически схождения" на чуть меньше, чем 300 белках (проблема с многофункциональными белками в том, что их второй и последующие функциональные элементы притягивают своих родственников). "Практически схождение" - означает, что новые белки возникают не более, чем по 5-10 шт (для данного случая). Правда, эти би- и много- функциональные белки, конечно же, возвращались в таблицу на каждой итерации и их прихоилось снова исключать из обработки |