Профили

Построение профиля

Для построения профиля был создан отдельный файл с выравниванием последовательностей домена Lipase таксона Mammalia из архитектуры Lipase+PLAT (золотой стандарт). Затем последовательно командами hmmbuild был создан профиль. Для проверки профиля нужен файл, включающий все последовательности, содержащий данный домен. Он был получен с помощью Retrieve с использованием AC из таблицы (недавний практикум). С помощью hmmsearch был получен файл Так как использовалась версия HMMER3, то калибровка не нужна.

Оценка параметров профиля

Оценим параметры созданного профиля, сравнивая золотой стандарт с полученным файлом. Расчеты приведены в файле. При пороге e-value = 6.5e-100 получены следующие значения:
TP = 7
TN = 1353
FP = 390
FN = 0
R (чувствительность) = 1
PPV (избирательность) = 0,017632242

Видно, что чувствительность высока, в то время как избирательность не очень. Если увеличить порог e-value до 6.6e-150, то при чувствительности 1 избирательность повысится лишь до 0,0504. Что свидетельствет о том, что работа профиля прошла не очень удачно.

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru