PSI-BLAST

Задание 1.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
P18196 MINC_ECOLI 3(список не сходился, поэтому после 2-го шага итерации убрали 8 последних находок и 1 после 3-го) 162 0.005 0.006 189 0.003 0.012
P0A832 SSRP_ECOLI 1 514 3е-10 5.6 514 3е-10 5.6
P17265 RP5M_RHIME 3 14 0.001 0.005 25 9e-15 0.14
P54716 GLVA_BACSU 1(пришлось назначить порог на E-value 0,0005) 18 3e-82 7e-04 18 3e-82 7e-04

Во всех случаях с ростом итерации растет и разрыв E-value. В первом случае он изменился не так значительно из-за вручную вносимых коррективов для схождения поиска.

Задание 2.

При e-value 0.001 поиск последовательности P18196 стабилизировался после 2-й итерации, так как e-value назначено меньше, то и требования к находкам строже,а значит случайные последовательности отсеиваются в большей степени, но несмотря на это поиск моего белка стабилизировался только после назначения e-value 0.005. А до этого поиск не сходился, даже если убирать кажущиеся случайными последовательности. Скорее всего это из-за того, что какие-то неспецифические участки портят матрицу и тащат лишние последовательности.