Профили

Поскольку ни одна группа последовательностей (таксон+архитектура) из прошлого практикума не образует отдельную ветвь, для построения профиля были взяты те последовательности из B_H, которые группируются вместе. Для них было выделено отдельное выравнивание.

По ним был построен (программой hmm2build) и откалиброван (программой hmm2calibrate) профиль.

Был произведён поиск программой hmm2search среди белков с доменом PF01926 - (выдача).

Результаты поиска сравнивали со списком белков из подсемейства.

Расчет TP, FP, TN, FN, чувствительности R и избирательности PPV можно посмотреть в файле hmm.xlsx. Был выбран порог e-value = 2.2E-70. При таком пороге R = 0,64 , а PPV = 0,04.

Качество работы профиля нельзя охарактеризовать даже как удовлетворительное, потому что избирательность очень мала, вне зависимости от порога.