Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2016

В отчете на сайте должно быть:

  1. Описание целевого семейства в таком виде, что понятно каким образом найти все белки семейства в банке SwissProt по аннотациям и (возможно) вашему паттерну

  2. Ссылка на таблицу Excel
    • (лист 1) со списком ID всех белков SwissProt, принадлежащих семейству согласно описанию из п. 1.

    • (лист 2)со списком результатов поиска по вашему HMM профилю; обязательные колонки: ID находки, вес, E-value, принадлежит ли целевому семейству на самом деле - согласно списку листа 1
    • (лист 3)с гистограммой весов находок
    • (лист 4)с данными для построения ROC-кривой и/или PR-кривой
  3. Ссылка на файл с выравниванием, которое использовано для создания профиля и/или рисунок с этим выравниванием из JalView на веб-странице

  4. Ссылка на файл с HMM профилем
  5. Рисунок с гистограммой весов находок на веб-странице
  6. Рисунок с PR-кривой и/или ROC кривой на веб-странице
  7. Выбранный вами порог веса для находок.Обосновние выбора порога веса
  8. Табличка 2×2 с результатами при выбранном пороге: на самом деле (принадлежит семейству, нет) против предсказания по профилю (принадлежит семейству, нет). Чувствительность, специфичность, precision (точность, доля правильных предсказаний среди всех предсказаний) для вашего профиля и порога;

  9. Неформальная оценка качества профиля: насколько он хорош для нахождения целевого семейства белков; если недостаточно точен, то вероятные причины ошибочных предсказаний

указания

Задание 1. Определите целевое семейство белков. Составьте список белков семейства из `SwissProt`

Задание 2. Постройте и откалибруйте профиль для целевого семейства

Задание 3. Получите результаты поиска по профилю на множестве последовательностей SwissProt

Задание 4. Выберите порог нормализованного веса для находок по профилю

Задание 5.(* не обязательное) Сравните ваше правило с поиском blast по SwissProt для одной последовательности из вашего семейства