На главную
II семестр

PSI-Blast

Варианты расхождения результатов для различных белков

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
P18196 P18196, GI:127096 4 162 0,005 0,005 604 0,005 0,005
Комментарий После второй итерации на самой границе допустимых значений появляется 1 белок с другой функцией (Protein translocase subunit secA, AC:A7H8E6.1), который тащит за собой своих гомологов - получается смесь, которая тянет за собой еще... Расходится
Но, у этого белка e-value == 0,003, в то время, как следующий гомолог имеет e-value порядка 10-7. Если этот лишний белок исключить из следующей итерации, то набор тут же сходится - будет найден только один новый, явно посторонний белок (e-value == 0,002, в то время, как у следующего - уже порядка 10-10). Того же эффекта можно добиться, установив пороговое значение e-value на 0,001 (для 0,002 появляется посторонний белок на 3-ей итерации)
P0A832 P0A832, GI:67472569 2 514 3*10-10 5,4 514 5*10-31 0,35
Комментарий Сразу все с такой же функцией идут с очень низким e-value, а еще всего три оставшихся - имеют другие функции и большой (>5) e-value. Ничего нового psi не находит (только несколько белков, которые он сам не считает гомологами из-за слишком большого e-value). А e-value гомологов уменьшается с каждой итерацией
P17265 P17265 4 15 0,005 0,12 25 8*10-15 0,025
Комментарий Почти все найденные BlastP гомологи - белки с неопределенной и даже не предположенной функцией. После второй итерации e-value худших гомологов порядка 10-7. После 3 итерации - всего 1 новый белок. Хотя его e-value и довольно велико, после 4 итерации - e-value резко падает и новых белков он за собой не тянет
P39594 P39594, GI:732341 3 296 0,003 0,007 1086 0,005 0,005
Комментарий Мой белок - расходится. Но, выбросив би- и много-функциональные белки из сравнения, я добился "практически схождения" на чуть меньше, чем 300 белках (проблема с многофункциональными белками в том, что их второй и последующие функциональные элементы притягивают своих родственников). "Практически схождение" - означает, что новые белки возникают не более, чем по 5-10 шт (для данного случая). Правда, эти би- и много- функциональные белки, конечно же, возвращались в таблицу на каждой итерации и их прихоилось снова исключать из обработки