Для работы был выбран домен Ribosomal_S2 (PF00318). Таксон, выбранный для составления этого профиля – Proteobacteria.
Была получена таблица Excel, по которой с помощью средств Python были построены гистограмма и график ROC-кривой.
Исходное выравнивание,
полученный профиль.
Рисунок 2. ROC-кривая полученного профиля.
В качестве порога было выбрано значение score = 546.5.
Positive answer | Negative answer | |
Truly positive | 398 | 6 |
Truly negative | 55 | 1086 |
Полученный профиль получился высокоточным; его чувствительность составляет ~88%.