Практикум 8.HMM профиль.ROC-кривая

Для построения профиля была определена выборка из домена PF00163 у представителей proteobacteria. database:(type:pfam id:PF00163) taxonomy:proteobacteria AND reviewed:yes Было найдено 435 последовательностей. Был выбран данный домен, так как по нему строился паттерн в практикуме 6. Все хаходки в Uniprot представлены на листе 1. Таблицы. Сводная таблица
Было отобрано 17 последовательностей, одну из них пришлось удалить, так как она сильно отличалась от остальных Выравнивание
Ниже представлен рисунок, отображающий часть выравнивания.

Рис.1
Файл с HMM профилем (он был дополнительно откалиброван) Профиль
Далее были построена гистограмма весов находок (Рис.2), а также ROC-кривая (Рис.3)

Рис.2

Рис.3
Примечания: в качестве порога было выбрано значение 100. Так как после этого значения, четко прослеживается скачок. Сводная таблица:
Рис.2
По данному порогу видно, что построенный профиль нельзя считать достоверным, так как несмотря на хороший показатель специфичности, чувствительность составила всего лишь 13%, а показатель precision 45%