Учебная страница курса биоинформатики,
год поступления 2013
Порядок проведения
- Ответы на вопросы из теории.
- Защита результата зачётного задания из практикума 11.
- Выполнение практического задания.
Теория
- Примеры сигналов (не менее пяти, с объяснением). Задача поиска.
- Оценка сигнала, представленного выравниванием. Информационное содержание колонки (формула, какие значения может принимать). Псевдокаунты. Информационное содержание выравнивания. LOGO.
- Профиль PWM. Логарифм правдоподобия (формула) и его теоретическое обоснование.
- Профиль PWM. Матрица весов по Миронову (формула, привести пример вычисления веса). Что такое Z-score. Вес выравнивания профиля и последовательности (формула).
Постановка задачи поиска сигнала de novo. Идея алгоритма Expectation Maximization (EM). MEME.
- Идея алгоритма Gibbs Sampler (GS). Недостатки алгоритмов EM и GS.
- Технология поиска сигналов (на примере сайтов связывания транскрипционных факторов прокариот).
- Непрерывная эволюция последовательности белка и крупные эволюционные события. Эволюционные домены.
- HMM профиль выравнивания последовательностей домена. Вычисление веса последовательности относительно HHM профиля (на примере).
- Оценка результатов поиска по профилю на множестве последовательностей, про которые известна принадлежность или нет семейству. ROC кривая.
Умения
- Использование MEME и MAST для обнаружения мотивов и поиска их в последовательностях
- Использование HMMer для составления профиля семейства последовательностей и поиска в БД
- Выбор порога с помощью ROC кривой в применении к результатам поиска по профилю во множестве последовательностей с известным ответом. Характеристика качества профиля.
- Выбор метода построения дерева. Интерпретация полученного дерева для домена.
В процессе...