Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Порядок проведения

  1. Ответы на вопросы из теории.
  2. Защита результата зачётного задания из практикума 11.
  3. Выполнение практического задания.

Теория

  1. Примеры сигналов (не менее пяти, с объяснением). Задача поиска.
  2. Оценка сигнала, представленного выравниванием. Информационное содержание колонки (формула, какие значения может принимать). Псевдокаунты. Информационное содержание выравнивания. LOGO.
  3. Профиль PWM. Логарифм правдоподобия (формула) и его теоретическое обоснование.
  4. Профиль PWM. Матрица весов по Миронову (формула, привести пример вычисления веса). Что такое Z-score. Вес выравнивания профиля и последовательности (формула).
  5. Постановка задачи поиска сигнала de novo. Идея алгоритма Expectation Maximization (EM). MEME.

  6. Идея алгоритма Gibbs Sampler (GS). Недостатки алгоритмов EM и GS.
  7. Технология поиска сигналов (на примере сайтов связывания транскрипционных факторов прокариот).
  8. Непрерывная эволюция последовательности белка и крупные эволюционные события. Эволюционные домены.
  9. HMM профиль выравнивания последовательностей домена. Вычисление веса последовательности относительно HHM профиля (на примере).
  10. Оценка результатов поиска по профилю на множестве последовательностей, про которые известна принадлежность или нет семейству. ROC кривая.

Умения

  1. Использование MEME и MAST для обнаружения мотивов и поиска их в последовательностях
  2. Использование HMMer для составления профиля семейства последовательностей и поиска в БД
  3. Выбор порога с помощью ROC кривой в применении к результатам поиска по профилю во множестве последовательностей с известным ответом. Характеристика качества профиля.
  4. Выбор метода построения дерева. Интерпретация полученного дерева для домена.