|
1. Характеристики списка находок
Был взят белок Putative periplasmic iron-binding protein из организма Serratia
plymuthica PRI-2C (ANS42615.1).
Программой BLAST были найдены в банке Swiss-Prot белки с последовательностями,
наиболее сходными с данной.
wordsize |
Всего находок |
Находок с E-value < 0.001 |
Максимальное E-value |
Список находок лимитирован |
6 |
35 |
33 |
0.12 |
порогом на E-value |
2. Изменение длины слова
Если изменить wordsize на 2:
wordsize |
Всего находок |
Находок с E-value < 0.001 |
Максимальное E-value |
Список находок лимитирован |
2 |
52 |
40 |
8.2 |
порогом на E-value |
3. Изменение объёма поиска
Возьмем одну из находок данного поиска, ее E-value=1e-12. Зайдя в соответствующую запись Swiss-Prot,
выберем один из достаточно "высоких" таксонов организма, из которого взят этот белок
(мой выбор пал на a-proteobacteria (taxid:28211)).
Повторим предыдущий поиск, ограничив его выбранным таксоном (банк тот же, wordsize=2).
Теперь у нас есть 13 находок, а E-value выбранной находки стал =6e-14, то есть уменьшился на два порядка (в ~17 раз).
Это означает, что количество последовательностей белков из данного таксона в банке в 17 раз
меньше, чем вообще всех записей.
|
|