Задание 1.
ID белка | AC белка | Число итераций | Для первой итерации | Для последней итерации | ||||
Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | Число находок выше порога (0,005) | Худшее E-value выше порога | Лучшее E-value ниже порога | |||
P18196 | MINC_ECOLI | 3(список не сходился, поэтому после 2-го шага итерации убрали 8 последних находок и 1 после 3-го) | 162 | 0.005 | 0.006 | 189 | 0.003 | 0.012 |
P0A832 | SSRP_ECOLI | 1 | 514 | 3е-10 | 5.6 | 514 | 3е-10 | 5.6 |
P17265 | RP5M_RHIME | 3 | 14 | 0.001 | 0.005 | 25 | 9e-15 | 0.14 |
P54716 | GLVA_BACSU | 1(пришлось назначить порог на E-value 0,0005) | 18 | 3e-82 | 7e-04 | 18 | 3e-82 | 7e-04 |
Во всех случаях с ростом итерации растет и разрыв E-value. В первом случае он изменился не так значительно из-за вручную вносимых коррективов для схождения поиска.
Задание 2.
При e-value 0.001 поиск последовательности P18196 стабилизировался после 2-й итерации, так как e-value назначено меньше, то и требования к находкам строже,а значит случайные последовательности отсеиваются в большей степени, но несмотря на это поиск моего белка стабилизировался только после назначения e-value 0.005. А до этого поиск не сходился, даже если убирать кажущиеся случайными последовательности. Скорее всего это из-за того, что какие-то неспецифические участки портят матрицу и тащат лишние последовательности.