ROC-кривая.Задание 1. Определите целевое семейство белков. Составьте список белков семейства из 'SwissProt'.Строить ROC-кривую было решено по выборке белков, характерных для отряда Приматы и содержащих домен
PF08516. 
  | 
 
Задание 2. Постройте и откалибруйте профиль для целевого семейства.Полученные аминокислотные последовательности были выровнены с помощью программы JalView. Выравнивание получилось очень кривое - с малым количеством консервативных позиций и с морем гэпов. Те фрагменты, что резали глаз сильнее всего, были удалены вручную. 
 Построение профиля: 
 Итог: профиль new_prof.out
  | 
 
Задание 3. Получите результаты поиска по профилю на множестве последовательностей SwissProt.
 Итог: файл find.out. Здесь содержится нужный нам список результатов поиска по полученному HMM профилю. Отсюда были взяты данные для будущей таблицы результатов.  | 
Задание 4. Выберите порог нормализованного веса для находок по профилю.Для разных выбранных порогов были вычислены коэффициенты Sensitivity (True Positive/ (True Positive + False negative)) и Specificity (True Negative/(False Positive + True Negative)). По величинам Sensitivity и 1-Specificity построена ROC кривая (Рис.2). 
 При построении ROC-кривой был выбран порог Score = 800. По построенной гистограмме (Рис.3) можно заметить, что существует ступенька, соответствующая данному значению. Значит, порог выбран правильно. 
 Рабочая таблица с данными, необходимыми для полного построения ROC-кривой, лежат в файле ADAM_primates.xlsx  | 
© Svetlana Kozyulina 2018