Учебный сайт Антона Васетенкова > Семестры > Семестр IV. Эволюция последовательностей > Блок 3: семейства белков > 13. Профили и паттерны

Menu

13. Профили и паттерны

Создаю профиль для поиска RdRP на основе фрагмента выравнивания из контрольной.

Провожу поиск по большой группе вирусных последовательностей (устанавливаю пороговое значение веса 1). Файл Excel с результатами поиска.

За погоровое значение веса беру 2.41 (при таком значении число белков, названных RdRP-белками, но на самом деле ими не являющихся, равно числу белков, не называнных RdRP, но на самом деле ими являющихся):

  RdRP Не dRP Всего
Предсказание RdRP 195 39 234
Предсказание не RdRP 39 2894 2933
Всего 234 2933 3167

Вычисляю:

Общее число 234
Процент ошибок 16.7%
Чувствительность 83.3%
Специфичность 98.7%

Строю ROC-кривую: