Составлен профиль данных последовательностей из семейства pf00680 на основе выравнивания в JalView.
Провели поиск по белкам вирусов с весом больше 1. Затем обрабатывали данные в Excel, считая находки, принадлежащие семейству pf00680, правильными, а остальные - неправильными. Для расчета осей ROC - кривой использовали формулы, как в предоставленном примере.
Подобрали порог веса для отличения правильных находок от неправильных и при таком пороге (4,3) создали таблицу результатов предсказания принадлежности семейству:
RdRP | Не RdRP | Всего | |
Предсказание RdRP | 176 | 4 | 180 |
Предсказание не RdRP | 69 | 2537 | 2606 |
Всего | 245 | 2541 | 2786 |
Чувствительность (процент правильно предсказанных среди всех RdRP) =72%
Специфичность ( процент правильно не предсказанных среди не RdRP)=99%