Учебная страница курса биоинформатики,
год поступления 2016
В отчете на сайте должно быть:
Описание целевого семейства в таком виде, что понятно каким образом найти все белки семейства в банке SwissProt по аннотациям и (возможно) вашему паттерну
- Ссылка на таблицу Excel
(лист 1) со списком ID всех белков SwissProt, принадлежащих семейству согласно описанию из п. 1.
- (лист 2)со списком результатов поиска по вашему HMM профилю; обязательные колонки: ID находки, вес, E-value, принадлежит ли целевому семейству на самом деле - согласно списку листа 1
- (лист 3)с гистограммой весов находок
- (лист 4)с данными для построения ROC-кривой и/или PR-кривой
Ссылка на файл с выравниванием, которое использовано для создания профиля и/или рисунок с этим выравниванием из JalView на веб-странице
- Ссылка на файл с HMM профилем
- Рисунок с гистограммой весов находок на веб-странице
- Рисунок с PR-кривой и/или ROC кривой на веб-странице
- Выбранный вами порог веса для находок.Обосновние выбора порога веса
Табличка 2×2 с результатами при выбранном пороге: на самом деле (принадлежит семейству, нет) против предсказания по профилю (принадлежит семейству, нет). Чувствительность, специфичность, precision (точность, доля правильных предсказаний среди всех предсказаний) для вашего профиля и порога;
- Неформальная оценка качества профиля: насколько он хорош для нахождения целевого семейства белков; если недостаточно точен, то вероятные причины ошибочных предсказаний
Задание 1. Определите целевое семейство белков. Составьте список белков семейства из `SwissProt`
Задание 2. Постройте и откалибруйте профиль для целевого семейства
- Выберите выравнивание, проверьте его
- Постройте профиль по выравниванию
- Откалибруйте профиль
Задание 3. Получите результаты поиска по профилю на множестве последовательностей SwissProt
Выполните поиск по SwissProt
- Подберите пороги по E-value и Весу так, чтобы среди находок было сравнимое число правильных и неправильных находок - нужно для подбора порога!
- Составьте таблицу (Excel,Лист 2)
Задание 4. Выберите порог нормализованного веса для находок по профилю
- Постройте гистограмму весов всех находок, хороших и плохих
- Постройте PR-кривую и/или ROC-кривую
- Выбарите порог, опишите предсказатель того, принадлежит ли последвательность целевому семейству. Представьте результаты проверки профиля.
- Напишите заключение о вашем предсказателе.
UNDER CONSTRUCTION