Учебная страница курса биоинформатики,
год поступления 2014
Программа коллоквиума
Сигналы
"Точные" сигналы
- Как найти ожидаемое число встреч данного слова в геноме?
- Метод основанный на марковской модели. Привести и объяснить формулу.
- Метод Карлина. Привести и объяснить формулу.
- Как измерить отклонение наблюдаемого числа слов в геноме от ожидаемого? Примеры исключительных слов.
- Почему динуклеотид CG встречается в геномах млекопитающих реже, чем ожидается?
- Для каких биологических процессов важен динуклеотид CG?
Информационное содержание мотива, заданного выравниванием
- Привести формулу для информационного содержания колонки нуклеотидного выравнивания
- построить график зависимости информационного содержания от частот букв в случае двухбуквенного алфавита W (A или T) и S (G Или C)
- Информационное содержание выравнивания
- формула
- грубая оценка ожидаемого числа встреч мотива с известным информационным содержанием во входной последовательности с известным числом нуклеотидов
- Объяснить LOGO
- Сильный и слабый сигнал - в чем разница? Как оценить силу сигнала?
Исследуйте поведение функции f(x) = x log2 (x/p) + y log (y/q) на отрезке [0,1] при условиях: 0 < x < 1, 0 < y < 1>, x + y = 1, p + q = 1. Можно считать p = q = 1/2
- Найдите максимум и минимум информационного содержания выравнивания длиной 10
- Известно, что информационное содержание выравнивания равно 12. Какой длины точный сигнал (т.е. слово) имеет примерно такое же информационное содержание?
Позиционная весовая матрица
- Что такое и как вычисляется позиционная весовая матрица выравнивания (PWM)?
- Какая задача решается с помощью PWM?
- Что такое псевдоотсчет (pseudocount), как и зачем его используют?
- Напишите выражение для веса выравнивания последовательности и PWM. Можно - на примере.
Поиск сигналов в данных Chip-seq
- Что такое Chip-seq?
- Основные этапы Chip-seq
- Какие данные получаются в результате Chip-seq эксперимента (вход для биоинформатического анализа)
- Что такое контрольный эксперимент и зачем он нужен?
- Как зависит результат от длин прочтений, покрытия прочтениями?
- Этапы биоинформатического анализа Chip-seq
- Как найти сигналы в данных Chip-seq?
- (*) Почему наблюдается сдвиг пиков от разных цепочек ДНК?
- Найдите сигнал TATA-box в геноме человека с помощью геномного браузера
Практическая молекулярная филогения
Построение филогенетического дерева
- Предобработка выравнивания
- зачем нужна?
- в чем состоит?
- Метод NJ и bootstrap
- Укоренение
Интерпретация филогенетического дерева
- Перечислить причины, влияющие на несовпадение реконструированного дерева с ходом эволюции гомологичных белков
- объективные
- технические
- Проверка сомнительных ветвей
- Рассказать о выводе по филогенетическому дереву домена из практикума 11
Профиль
- В чем отличие HMM профиля от PWM?
- Что такое профиль HMM?
- Как вычисляется вес выравнивания последовательности и профиля HMM?
- Зачем нужна калибровка профиля?
- Выбор порога веса для профиля
- Какие задачи можно решить с помощью ROC-кривой?
- Какие данные нужны для построения ROC-кривой?
- Что такое чувствительность и специфичность, как их вычислить по таблице 2x2?
- Алгоритм построения ROC-кривой. Можно с демонстрацией в Excel.