ROC-кривая.Задание 1. Определите целевое семейство белков. Составьте список белков семейства из 'SwissProt'.Строить ROC-кривую было решено по выборке белков, характерных для отряда Приматы и содержащих домен
PF08516.
|
Задание 2. Постройте и откалибруйте профиль для целевого семейства.Полученные аминокислотные последовательности были выровнены с помощью программы JalView. Выравнивание получилось очень кривое - с малым количеством консервативных позиций и с морем гэпов. Те фрагменты, что резали глаз сильнее всего, были удалены вручную.
Построение профиля:
Итог: профиль new_prof.out
|
Задание 3. Получите результаты поиска по профилю на множестве последовательностей SwissProt.
Итог: файл find.out. Здесь содержится нужный нам список результатов поиска по полученному HMM профилю. Отсюда были взяты данные для будущей таблицы результатов. |
Задание 4. Выберите порог нормализованного веса для находок по профилю.Для разных выбранных порогов были вычислены коэффициенты Sensitivity (True Positive/ (True Positive + False negative)) и Specificity (True Negative/(False Positive + True Negative)). По величинам Sensitivity и 1-Specificity построена ROC кривая (Рис.2).
При построении ROC-кривой был выбран порог Score = 800. По построенной гистограмме (Рис.3) можно заметить, что существует ступенька, соответствующая данному значению. Значит, порог выбран правильно.
Рабочая таблица с данными, необходимыми для полного построения ROC-кривой, лежат в файле ADAM_primates.xlsx |
© Svetlana Kozyulina 2018