Профили
Поскольку ни одна группа последовательностей (таксон+архитектура) из прошлого практикума не образует отдельную ветвь, для построения профиля были взяты те последовательности из B_H, которые группируются вместе. Для них было выделено отдельное выравнивание.
По ним был построен (программой hmm2build) и откалиброван (программой hmm2calibrate) профиль.Был произведён поиск программой hmm2search среди белков с доменом PF01926 - (выдача).
Результаты поиска сравнивали со списком белков из подсемейства.
Расчет TP, FP, TN, FN, чувствительности R и избирательности PPV можно посмотреть в файле hmm.xlsx. Был выбран порог e-value = 2.2E-70. При таком пороге R = 0,64 , а PPV = 0,04.
Качество работы профиля нельзя охарактеризовать даже как удовлетворительное, потому что избирательность очень мала, вне зависимости от порога.