13. Профили и паттерны
Создаю профиль для поиска RdRP на основе фрагмента выравнивания из контрольной.
Провожу поиск по большой группе вирусных последовательностей (устанавливаю пороговое значение веса 1). Файл Excel с результатами поиска.
За погоровое значение веса беру 2.41 (при таком значении число белков, названных RdRP-белками, но на самом деле ими не являющихся, равно числу белков, не называнных RdRP, но на самом деле ими являющихся):
RdRP | Не dRP | Всего | |
Предсказание RdRP | 195 | 39 | 234 |
Предсказание не RdRP | 39 | 2894 | 2933 |
Всего | 234 | 2933 | 3167 |
Вычисляю:
Общее число | 234 |
Процент ошибок | 16.7% |
Чувствительность | 83.3% |
Специфичность | 98.7% |
Строю ROC-кривую: