Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2010

Алгоритмы биоинформатики

Требуемые знания по вопросам, входящим в билеты, более или менее покрываются презентацией. Разумеется, "на пятёрку" надо будет знать подробности, которые в презентацию не входят. В любом случае просто выписать формулу недостаточно, надо понимать смысл всех входящих в формулу обозначений.

Подробности по большинству вопросов есть в книге Дурбина с соавт.

По проблеме малой сложности см. статьи:

Из этих статей, разумеется, нужно учить не всё, а лишь постановку задачи и описания алгоритмов.

В качестве дополнительных вопросов могут быть заданы относящиеся к темам лекций А.Фаворова: о методе Монте-Карло и о множественном тестировании.

Билеты

  1. Задача парного выравнивания. Количество выравниваний. Вес выравнивания. Наибольшее общее слово и наибольшая общая подпоследовательность как частные случаи оптимального выравнивания.
  2. Алгоритмы выравнивания Нидлмана – Вунша и Миллера – Маерса (при линейных штрафах за делецию).

  3. Алгоритм выравнивания при общих штрафах за делецию. Алгоритм выравнивания при аффинных штрафах за делецию.
  4. Локальное выравнивание. Алгоритм Смита – Уотермана.

  5. Матрицы BLOSUM и вероятностная модель, на которой они основаны. Матрицы PAM.
  6. Модели случайных последовательностей. Статистика локальных выравниваний. P-value и E-value.
  7. Быстрое выравнивание и поиск по банку. Отбор диагоналей. Fasta. Хэширование ("затравки"). BLAST, BLAST2.
  8. Проблема малой сложности. Программы seg и dust.
  9. Корректировка матрицы замен по Юй и Альтшулю.
  10. Байесова статистика. Априорное и апостериорное распределение. Распределение Дирихле. Оценка наибольшего правдоподобия, оценка по матожиданию и оценка по максимальной апостериорной вероятности. Оценка параметров по результатам наблюдения.
  11. Скрытые марковские модели (HMM). Эмиссионные и переходные вероятности. Примеры HMM.
  12. Алгоритм Витерби.
  13. Алгоритм "вперёд-назад".
  14. Оценка параметров HMM при наличии обучающей выборки. Биологические примеры. Показатели качества обучения.
  15. Оценка параметров HMM при отсутствии обучающей выборки. Обучение по Витерби. Алгоритм Баума – Велча.

  16. HMM для парного выравнивания.
  17. Множественное выравнивание. Оценка качества выравнивания. Энтропия колонки, сумма весов пар.
  18. Профили (PSSM). HMM профиль. Учет возможности вставок и делеций.
  19. Псевдоотсчеты. Правило Лапласа. Учет фоновых частот. Учет матрицы замен. Связь с байесовой статистикой.
  20. Взвешивание последовательностей. Метод Герштейна – Сонхаммера – Чотьи. Метод Хеникофф. Максимизация энтропии. Многогранники Вороного.

  21. Алгоритмы множественного выравнивания. Динамическое программирование. Прогрессивное выравнивание. Улучшение выравнивания. ClustalW и Muscle.
  22. Поиск сигналов. Постановка задачи. Алгоритм MEME. Выборки Гиббса.
  23. Вторичная структура РНК. Элементы вторичной структуры. Энергия вторичной структуры РНК. Алгоритмы предсказания вторичной структуры.