Учебная страница курса биоинформатики,
год поступления 2020
Темы
1. Сигналы в молекулярной биологии
- Приведите примеры сигналов разных типов [тип сигнала - что является сигналом на мол. уровне]. В примерах объясните также кому адресован сигнал и какова ожидаемая реакция адресата на сигнал.
- Сигналы транскрипции
- Сигналы трансляции
- Примеры сигналов регуляции экспрессии генов
- Сигналы у прокариот и эукариот: транскрипции, трансляции, сплайсинга и др.
1'. Мотивы
- Объясните термин "мотив", к каким типам сигналов он применим. Приведите пример.
- Объясните разницу между "сильным" сигналом и "эффективным" сигналом.
Консенсус и паттерн. Применительно к сигналу в последовательности ДНК или РНК.
2. Позиционная весовая матрица (PWM)
- Для чего применяется матрица PWM. Объясните алгоритм расчёта PWM [вход, как вычисляется элемент матрицы] и правило её применения к последовательности
Псевдоотсчёты (pseudocounts) [что такое? зачем нужны? как задаются?]
3. Информационное содержание выравнивания
- Что отражает информационное содержание
- Размер матрицы IC и как вычисляется элемент матрицы.
- Максимальное и минимальное значение информационного содержания колонки
- Грубая оценка числа находок мотива, заданного выравниванием, в случайном банке
- Logo выравнивания
4. Технология поиска сигналов в ДНК или РНК
- Объясните план работы для поиска промоторов в геноме новой бактерии, не имеющей близких родственников с известным геномом (или решения другой аналогичной задачи)
4'. Алгоритмы обнаружения мотивов в последовательностях
- Назовите алгоритмы, решающие эту задачу.
- Алгоритм ME
- Параметры программы MEME, алгоритм. Роль размера области поиска.
- Поиск сигналов с помощью PWM. FIMO из пакета MEME-suite.
5. Оценка представленности слова или паттерна
- Предсказание числа встреч данного слова в геноме "по Бернулли"
- Причины возможной неточности оценки по Бернулли
- Идея более точных методов предсказания
БЕЛКИ
6. PSSM и PSI-BLAST
- Что такое PSSM
- Алгоритм PSI-BLAST
- Почему PSI-BLAST иногда позволяет найти достоверные гомологи, которые не находятся обычным BLAST?
7. Технология профилей
- Чем отличаются входные данные для построения HMM-профиля от входных данных для построения PWM?
- В чем состоит результат поиска с помощью профиля в БД
- Как оценивать результат поиска на тестовом множестве с известным ответов (содержит домен или нет)? (*)
8. Pfam
- Объясните, что такое эволюционный домен белка и что такое его доменная архитектура.
- Что является единицей хранения в БД Pfam? Перечислите доступные данные.
- Как найти все записи Uniprot,с определённым доменом Pfam или заданной доменной архитектурой. (*)
UNDER CONSTRUCTION
.