Контрольная работа

Используя выравнивание 10 последовательностей РНК-зависимых РНК полимераз (RdRP) вирусов из pfam семейства pf00680, созданное в классе, был сделан профиль.

Далее с помощью данного профиля я осуществила поиск по белкам вирусов (файл sw-viruses.fasta), выбирая все находки с весом больше 1.

На основе полученного результата в Exel была построена ROC-кривая.


Для расчета использовались формулы, приведенные в примере для расчета ROC-кривой. Для отличения правильных находок от неправильных был выбран порог веса 2.
RdRP Не RdRP Всего
Предсказание RdRP 161 4 165
Предсказание не RdRP 53 406 459
Всего 214 410 624

Чувствительность (процент правильно предсказанных среди всех RdRP) =75%

Специфичность ( процент правильно не предсказанных среди не RdRP)=99%