BLAST
Характеристики списка находок
Всего находок: 100.
Находок с E-value менее одной тысячной: 100.
Максимальное E-value: 6e-107.
Поиск был лимитирован максимальным числом находок (100), так как максимальный E-value гораздо меньше порога по умолчанию (10).
После увеличения максимального числа находок до 5000 было найдено 400, что свидетельствует уже о работе порога на E-value. Максимальный E-value здесь
- 5e-17. Если увеличить порог на E-value до 100, то после этой четырехсотой находки (5e-17) идет находка с E-value 37, что еще раз подтверждает то, что поиск
был лимитирован именно порогом на E-value.
Изменение длины слова
После изменения длины слова с 6 на 2 в выдаче программы (с параметрами 100 для максимального числа находок и 10 для порога E-value) ничего не поменялось.
Изменение объёма поиска
Для этого задания была взята 100-ая находка из предыдущего поиска (идентификатор: B0CCF6.1) с очень хорошим E-value 6e-107. Этот белок принадлежит цианобактерии Acaryochloris marina MBIC11017. Ее
систематическое положение:
Bacteria; Cyanobacteria; Synechococcales; Acaryochloridaceae; Acaryochloris.
Для ограничения поиска был взят таксон Cyanobacteria (taxid: 1117). Остальные параметры оставлены такими же, как в предыдущем поиске.
В результате было найдено 38 белков, то есть поиск был ограничен порогом на E-value. E-value последовательности B0CCF6.1 уменьшился с 6e-107 до 1e-108, что
свидетельствует о том, что случайное выравнивание с таким же или большим весом найти стало труднее. А труднее стало потому, что объём поиска был уменьшен (примерно в 100 раз), и в
рассматриваемой части банка SwissProt меньше белков. E-value уменьшился совсем чуть-чуть, следовательно всего белков в данном таксоне много.
Вес (и обычный, и битовый) поменяться от изменения объёма поиска не может, так как параметры выравнивания (матрица, штрафы за гэпы) изменены не были.