Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

Вопросы к экзамену по алгоритмам биоинформатики

  1. Глобальное выравнивание. Алгоритм Нидльмана – Вунша. Локальное выравнивание. Алгоритм Смита – Ватермана. Алгоритм выравнивания для аффинных штрафов за делецию.

  2. Статистика выравниваний. Наибольшее общее слово. Наибольшая общая подпоследовательность. Линейное и логарифмическое поведение веса выравнивания.
  3. Поиск по банку. Хэширование. FASTA, BLAST, BLAST2. Распределение экстремальных значений. e-value и p-value.
  4. HMM. Эмиссионные и переходные вероятности. Примеры HMM. Алгоритм Витерби. Алгоритм forward-backward.
  5. Оценка параметров HMM при наличии обучающей выборки. Оценка параметров при отсутствии обучающей выборки. Алгоритм Баума – Велча. Оценка качества обучения.

  6. Профили. Консенсус, регулярное выражение, частотный профиль. Энтропия колонки. HMM профиль, учет возможности вставок и делеций.
  7. Определение параметров HMM-профиля. Псевдоотсчеты. Правило Лапласа, учет фоновых частот и матрицы замен. Взвешивание последовательностей.
  8. Парные HMM. Глобальное и локальное выравнивание. Алгоритм Витерби. Апостериорное декодирование. Субоптимальные выравнивания.
  9. Алгоритм MEME. Гиббс сэмплер.
  10. Множественное выравнивание. Энтропия, Сумма пар. Динамическое программирование. Прогрессивное выравнивание. ClustalW и ProbCons.

  11. Вторичная структура РНК. Элементы вторичной структуры. Энергия вторичной структуры РНК. Алгоритм Нуссинофф. Алгоритм Зукера.
  12. Статистические суммы, вероятность спаривания, субоптимальные вторичные структуры РНК.
  13. Консенсусные вторичные структуры. Метод ковариаций.
  14. Байесова статистика. Априорные и апостериорные вероятности. MAP-оценка, E-оценка.
  15. Классификаторы. Наивный Байесов классификатор, решающие деревья, случайный лес. Метод опорных векторов (SVM).
  16. Кластеризация, иерархическая кластеризация, метод k-средних.
  17. Факторный анализ, анализ главных компонент, многомерное шкалирование.
  18. Сборка генома. Контиг, скаффолд. Проблема повторов.
  19. Транскриптомика и ChIP-seq. Картирование и нормализация. Понятие о GWAS.
  20. Проблема множественного тестирования. Поправка Бонферрони, метод Вестфала – Янга (Westfall-Young), метод Бенджамини – Хочберга.