Задание1. Итеративный поиск программой PSI-BLAST по банку Swiss-Prot для аминокислотных последовательностей P18196, P0A832, P17265 и O31562 (yfit_bacsu).

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI  P18196  5 (не посл.)  162  0.005  0.006  886  2e-05  0.15 
SSRP_ECOLI  P0A832  514  3e-10  5.6  514  5e-31  0.36 
RP5M_RHIME  P17265  14  0.001  0.005  25  9e-15  0.14 
YFIT_BACSU  O31562  18  4e-24  0.60  19  3e-30  0.025 

  • Судя по общей тенденции от итерации к итерации, замечаю, что разрыв между E-value у худшей находки находки выше порога и лучшей ниже него увеличивается, хотя есть выпадающие из этого наблюдения изменения (напр., при поиске гомологов второго белка оказалось, что E-value лучшей ниже порога последовательности резко уменьшился, что не совпадает с общей направленностью процесса).
  • E-value лучшей находки увеличивался, а средней - уменьшался.

    Задание2. Работа с белком MINC_ECOLI, для которого нехватило 5 итераций для поиска всех гомологов с E-value выше 0,005.

  • Уменьшил пороговое E-value до 0,001.
  • Список стабилизировался на 3 итерации, так как в связи с уменьшением критического E-value число гомологов также уменьшилось, о чем свидетельствует ниже приведенная таблица.

    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI  P18196  155  0.001  0.001  188  3e-10  0.001 

  • Полагаю, что нельзя добиться аналогичных результатов, увеличив порог, так как лудшее из худших значений уже 0,001. Если бы было что-то большее, то можно было бы выбрать это.
    ©Vakil Takhaveev