#pragma css /css/2016.css
<<BI>>

{{{#!wiki comment
UNDER CONSTRUCTION
}}}

=== В отчете на сайте должно быть: ===
 1. Описание целевого семейства в таком виде, что понятно каким образом найти все белки семейства в банке `SwissProt` по аннотациям и (возможно) вашему паттерну 
 1. Ссылка на таблицу Excel 
   * (лист 1) со списком ID всех белков `SwissProt`, принадлежащих семейству согласно описанию из п. 1. 
   * (лист 2)со списком результатов поиска по вашему HMM профилю; обязательные колонки: ID находки, вес, E-value, принадлежит ли целевому семейству на самом деле - согласно списку листа 1
   * (лист 3)с гистограммой весов находок 
   * (лист 4)с данными для построения ROC-кривой и/или PR-кривой
 1. Ссылка на файл с выравниванием, которое использовано для создания профиля и/или рисунок с этим выравниванием из `JalView` на веб-странице
 1. Ссылка на файл с HMM профилем
 1. Рисунок с гистограммой весов находок на веб-странице
 1. Рисунок с PR-кривой и/или ROC кривой на веб-странице
 1. Выбранный вами порог веса для находок.Обосновние выбора порога веса
 1. Табличка 2&times;2 с результатами при выбранном пороге: на самом деле (принадлежит семейству, нет) против предсказания по профилю (принадлежит семейству, нет). Чувствительность, специфичность, precision (точность, доля правильных предсказаний среди всех предсказаний) для вашего профиля и порога;
 1. Неформальная оценка качества профиля: насколько он хорош для нахождения целевого семейства белков; если недостаточно точен, то вероятные причины ошибочных предсказаний

[[/hints|указания]]

=== Задание 1. Определите целевое семейство белков. Составьте список белков семейства из `SwissProt` ===

=== Задание 2.  Постройте и откалибруйте профиль для целевого семейства ===
  * Выберите выравнивание, проверьте его 
  * Постройте профиль по выравниванию
  * Откалибруйте профиль

=== Задание 3. Получите результаты поиска по профилю на множестве последовательностей SwissProt ===
  * Выполните поиск по `SwissProt`
  * Подберите пороги  по E-value и Весу так, чтобы среди находок было сравнимое число правильных и неправильных находок - нужно для подбора порога!
  * Составьте таблицу (Excel,Лист 2)

=== Задание 4. Выберите порог нормализованного веса для находок по профилю ===
  * Постройте гистограмму весов всех находок, хороших и плохих
  * Постройте PR-кривую и/или ROC-кривую
  * Выбарите порог, опишите предсказатель того, принадлежит ли последвательность целевому семейству. Представьте результаты проверки профиля. 
  * Напишите заключение о вашем предсказателе.

=== Задание 5.(* не обязательное) Сравните ваше правило с поиском blast по SwissProt для одной последовательности из вашего семейства ===