Мной были использованны белки, находившиеся по запросу "database:(type:pfam id:PF00512) taxonomy:"Alphaproteobacteria [28211]" AND reviewed:yes", то есть белки, включающие в себя домен HisKA и принадлежащие альфапротеобактериям.
Мною были получено выравнивание белков, которое было в дальнейшем использовано для создания HMM профиля.
Далее представленны диаграммы, отражающие процесс поиска порога. Все данные, которые использовались в работе, представленны в этом файле.
Рис.1: Гистограмма весов
Рис.2: ROC кривая
наиболее подходящим оказался порог Score = 100, он соответствовал параметрам:
Специфичность: 1;
Чувствительность: 0,87;
Precision: 1;
Порог, как понятно из значений, выдавал только верно предсказанные белки. Так что он точно может использоваться для поиска домена PF00512 в альфапротеобактериях нашим профилем, так как даёт максимально большие показатели.
Таб.1: Параметры порога 100
TP = 33 | TN = 2 |
FP = 0 | FN = 0 |