Учебная страница курса биоинформатики,
год поступления 2018
Это черновая версия, ревизия прошлогодних вопросов. Не уверен, что все успеем пройти, т.к. моя парадигма: лучше меньше да лучше. С другой стороны, м.б. что-то еще появится, не знаю, что ААл
Темы и вопросы
1. Мотивы
Обьясните термины. Cигнал, виды сигналов. Приведите примеры сигналов разных видов. Мотив. Сильный сигнал, слабый сигнал.
Консенсус и паттерн. Применительно к сигналу в последовательности ДНК или РНК.
2. Позиционная весовая матрица (PWM)
- Отношение правдоподобия и его логарифм.
Псевдоотсчёты (pseudocounts): что такое и зачем нужны, как задаются?
PWM по выравниванию последовательностей Какие данные необходимы. Этапы вычисления и/или итоговая формула
Детекция сигналов в последовательности. Параметры MEME, алгоритм. Роль размера области поиска.
Поиск сигналов при известной PWM. Вес выравнивания последовательности и позиционной весовой матрицы.
Поиск сигналов с помошью PWM Mast из пакета MEME-suite.
3. Информационное содержание выравнивания
- Зачем нужно информационное содержание
- Информационное содержание буквы в колонке, колонки выравнивания и выравнивания в целом (формулы)
- Максимальное и минимальное значение информационного содержания колонки
- Грубая оценка числа находок мотива, заданного выравниванием, в случайном банке
- Logo выравнивания
4. Технология поиска сигналов в ДНК
- Основы Chip-seq эксперимента. Контроль в Chip-seq эксперименте.
- Upstream оьласти генов
БЕЛКИ
5. PSSM и PSI-BLAST
- Что такое PSSM
- Алгоритм PSI-BLAST
- Почему PSI-BLAST иногда позволяет найти достоверные гомологи, которые не находятся обычным BLAST?
7. Технология профилей
- Чем отличаются входные данные для построения HMM-профиля от входных данных для построения PWM?
- Как устроено решающее правило (принадлежит белок заданному семейству или нет), если семейство описано посредством профиля?
8. Pfam
- Объясните, что такое эволюционный домен белка и что такое его доменная архитектура.
- Что является единицей хранения в БД Pfam? Перечислите доступные данные.
- Как найти все записи Uniprot, в которых аннотирован определенный домен.
Для зачета студент должен получить зачет по каждой из 8 тем, т.е. правильно ответить по крайней мере на один вопрос по каждой теме