PSI-BLAST.

1)Результаты поиска:

ID белка

AC белка

Число итераций

Для первой итерации

Для последней итерации

Число находок выше порога (0,005)

Худшее E-value выше порога

Лучшее E-value ниже порога

Число находок выше порога (0,005)

Худшее E-value выше порога

Лучшее E-value ниже порога

MINC_ECOLI

P18196

5

126

0,004

0,005

239

0,003

0,007

SSRP_ECOLI

P0A832

2

449

3e-10

5,0

449

8e-31

0.62

NUSB_ECOLI

P0A780

4

327

0,003

0,008

388

2e-12

0.031

ECOT_ECOLI

P23827

2

45

7е-7

4,5

45

6e-16

0,23


Итерации "сошлись" для всех последовательностей, кроме первой.
Для белка MINC_ECOLI даже после пятой итерации остались лишние последовательностио есть были найдены не только родственные белки.Это и объясняет тот факт,что "разрыв" значений E-value небольшой.

Для белков SSRP_ECOLI и ECOT_ECOLI итерации сошлись быстрее всегоже после второй итерации новых последовательностей выявлено не было.Это значит что psiblast сразу находил белки,родственные SSRP_ECOLI и ECOT_ECOLI.У находок с худшим E-value выше порога и лучшим E-value ниже порога виден оромный разрыв.Это объясняет то,что "отсеянные" белки не являются близкородственными данным.

Для белка NUSB_ECOLI посдедовательности выявлены после четвёртой итерации выборке оставались белки таких семейств:NUSB и RSMB.Белки RSMB ослабляют избирательность psiblast,и поэтому разрыв между значениями E-value меньшеем в случае с белком SSRP_ECOLI.

2)

Для тоготобы итерации сходились необходимо понизить порог с 0,005 до 0,001.

При такой подборке итерации сходятся после третьего запросабъясняется тем,что теперь в список не входят белки семейства,сильно отличающегося от MINC_ECOLI.Это белки семейства FRMA_PASPI.Таким образом,максимальное значение порога,вероятнее всего,равно 0,001.


©Терешкова Алеся,2009