Важные сайты:
Для построения профиля были отобраны домены семейства PF00246 из белков таксона Metazoa с доменной архитектурой II(Peptidase_M14, CarboxypepD_reg). На дереве выборки домены данного подсемейства образовывают отдельную кладу. Длалее выбранные белки были выравнены программой Jalview. Полученно выравнивание было сохранено в стокгольмском формате.
"Золотым стандартом" были выбранны следующие последовательности.
Далее программой HMMER3.0 по ранее полученному выравниванию сторилось построение профиля. Команда для запуска:
hmmbuild hout.txt al.stk
В результате был полученн следующий профиль по вырвниванию - полученный профиль.
Был получен фаста файл содержащий все белки имеющие домен PF00246. По этому файлу провелся поиск hmm2search с исользованием профиля.
hmm2search -o out.txt --incE 0.001 hout.txt all.fasta
Были получены слудующие параметры: TP =484 , TN =7649, FP = 0, FN = 0. По ним была подсчитана чувствительность R = TP/(TP+FN)= 0.06328 и избирательность PPV = TP/(TP+FP)=0.05951.
Проведем вторую итерацию с измененым e-value = 1.0E-100.
Были получены слудующие параметры: TP =484 , TN =(1025 - 484)=541, FP = 0, FN = 0. По ним была подсчитана чувствительность R = TP/(TP+FN)= 0.89464 и избирательность PPV = TP/(TP+FP)=0.47220.
Как видно из результатов, работу профиля нельзя охарактеризовать даже как удовлетворительное, потому что избирательность очень мала, как бы мы ни пытались менять пороги.