Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Это черновая версия, ревизия прошлогодних вопросов.
Не уверен, что все успеем пройти, т.к. моя парадигма: лучше меньше да лучше. 
С другой стороны, м.б. что-то еще появится, не знаю, что

   ААл

Темы и вопросы

1. Мотивы

  1. Обьясните термины. Cигнал, виды сигналов. Приведите примеры сигналов разных видов. Мотив. Сильный сигнал, слабый сигнал.

  2. Консенсус и паттерн. Применительно к сигналу в последовательности ДНК или РНК.

2. Позиционная весовая матрица (PWM)

  1. Отношение правдоподобия и его логарифм.
  2. Псевдоотсчёты (pseudocounts): что такое и зачем нужны, как задаются?

  3. PWM по выравниванию последовательностей Какие данные необходимы. Этапы вычисления и/или итоговая формула

  4. Детекция сигналов в последовательности. Параметры MEME, алгоритм. Роль размера области поиска.

  5. Поиск сигналов при известной PWM. Вес выравнивания последовательности и позиционной весовой матрицы.

  6. Поиск сигналов с помошью PWM Mast из пакета MEME-suite.

3. Информационное содержание выравнивания

  1. Зачем нужно информационное содержание
  2. Информационное содержание буквы в колонке, колонки выравнивания и выравнивания в целом (формулы)
  3. Максимальное и минимальное значение информационного содержания колонки
  4. Грубая оценка числа находок мотива, заданного выравниванием, в случайном банке
  5. Logo выравнивания

4. Технология поиска сигналов в ДНК

  1. Основы Chip-seq эксперимента. Контроль в Chip-seq эксперименте.
  2. Upstream оьласти генов


БЕЛКИ

5. PSSM и PSI-BLAST

  1. Что такое PSSM
  2. Алгоритм PSI-BLAST
  3. Почему PSI-BLAST иногда позволяет найти достоверные гомологи, которые не находятся обычным BLAST?

7. Технология профилей

  1. Чем отличаются входные данные для построения HMM-профиля от входных данных для построения PWM?
  2. Как устроено решающее правило (принадлежит белок заданному семейству или нет), если семейство описано посредством профиля?

8. Pfam

  1. Объясните, что такое эволюционный домен белка и что такое его доменная архитектура.
  2. Что является единицей хранения в БД Pfam? Перечислите доступные данные.
  3. Как найти все записи Uniprot, в которых аннотирован определенный домен.