Используя выравнивание 10 последовательностей РНК-зависимых РНК полимераз (RdRP) вирусов из pfam семейства pf00680, созданное в классе, был сделан профиль.
Далее с помощью данного профиля я осуществила поиск по белкам вирусов (файл sw-viruses.fasta), выбирая все находки с весом больше 1.
На основе полученного результата в Exel была построена ROC-кривая.
Для расчета использовались формулы, приведенные в примере для расчета ROC-кривой.
Для отличения правильных находок от неправильных был выбран порог веса 2.
RdRP | Не RdRP | Всего | |
Предсказание RdRP | 161 | 4 | 165 |
Предсказание не RdRP | 53 | 406 | 459 |
Всего | 214 | 410 | 624 |
Чувствительность (процент правильно предсказанных среди всех RdRP) =75%
Специфичность ( процент правильно не предсказанных среди не RdRP)=99%