Учебная страница курса биоинформатики,
год поступления 2012
Вопросы к экзамену по алгоритмам биоинформатики
Глобальное выравнивание. Алгоритм Нидльмана – Вунша. Локальное выравнивание. Алгоритм Смита – Ватермана. Алгоритм выравнивания для аффинных штрафов за делецию.
- Статистика выравниваний. Наибольшее общее слово. Наибольшая общая подпоследовательность. Линейное и логарифмическое поведение веса выравнивания.
- Поиск по банку. Хэширование. FASTA, BLAST, BLAST2. Распределение экстремальных значений. e-value и p-value.
- HMM. Эмиссионные и переходные вероятности. Примеры HMM. Алгоритм Витерби. Алгоритм forward-backward.
Оценка параметров HMM при наличии обучающей выборки. Оценка параметров при отсутствии обучающей выборки. Алгоритм Баума – Велча. Оценка качества обучения.
- Профили. Консенсус, регулярное выражение, частотный профиль. Энтропия колонки. HMM профиль, учет возможности вставок и делеций.
- Определение параметров HMM-профиля. Псевдоотсчеты. Правило Лапласа, учет фоновых частот и матрицы замен. Взвешивание последовательностей.
- Парные HMM. Глобальное и локальное выравнивание. Алгоритм Витерби. Апостериорное декодирование. Субоптимальные выравнивания.
- Алгоритм MEME. Гиббс сэмплер.
Множественное выравнивание. Энтропия, Сумма пар. Динамическое программирование. Прогрессивное выравнивание. ClustalW и ProbCons.
- Вторичная структура РНК. Элементы вторичной структуры. Энергия вторичной структуры РНК. Алгоритм Нуссинофф. Алгоритм Зукера.
- Статистические суммы, вероятность спаривания, субоптимальные вторичные структуры РНК.
- Консенсусные вторичные структуры. Метод ковариаций.
- Байесова статистика. Априорные и апостериорные вероятности. MAP-оценка, E-оценка.
- Классификаторы. Наивный Байесов классификатор, решающие деревья, случайный лес. Метод опорных векторов (SVM).
- Кластеризация, иерархическая кластеризация, метод k-средних.
- Факторный анализ, анализ главных компонент, многомерное шкалирование.
- Сборка генома. Контиг, скаффолд. Проблема повторов.
- Транскриптомика и ChIP-seq. Картирование и нормализация. Понятие о GWAS.
Проблема множественного тестирования. Поправка Бонферрони, метод Вестфала – Янга (Westfall-Young), метод Бенджамини – Хочберга.