1. Характеристики списка находок гомологов белка ALX12233.1.
C помощью алгоритма ВLAST в банке Swiss-Prot для белка ALX12233.1 были получены следующие результаты: 1. всего 110 находок. 2. 65 находок с E-value менее одной тысячной. 3. 4.8 максимальное E-value находки, выданное программой. 4. список находок лимитирован E-value, так в параметрах поиска максимальное число нахлдок было указано 2000.
2. Изменение длины слова.
C помощью алгоритма ВLAST в банке Swiss-Prot для белка ALX12233.1 при изменение длины слова с 6 на 2 были получены следующие результаты: 1. всего 373 находок. 2. 99 находок с E-value менее одной тысячной. 3. 9.9 максимальное E-value находки, выданное программой. 4. список находок лимитирован E-value, так параметрах поиска максимальное число нахлдок было указано 2000. Как мы видим, при изменении длины слова существенно изменились и количество находок, и количество с E-value менее одной тысячной, и максимальное E-value. Всё это говорит о том, что длина слова - важный параметр при поиске гомологов. Чем больше длина слова, тем быстрее работает алгоритм BLAST, но тем ниже его чуствительность. Таким образом, чем меньше длина слова, тем менее вероятно будет пропущен хороший гомолог.
3. Изменение объёма поиска.
Повторив предыдущий поиск,ограничив его таксоном Gammaproteobacteria (taxid:1236) были получены следующие результаты: 1. всего 142 находок. 2. E-value=3e-88 при выравнивании с белком P44878.1, в предыдущем поиске E-value=2e-87. 3. Вес в битах в обоих выравниваниях совпадает и равен 679. При изменении объёмы поиска Score выравнивания ни обычный, ни битовый измениться не может, так он не зависит от объёма поиска. Из формулы С.Карлина можно посчитать, что объем банка во втором случае в 6 раз меньше.