Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2019

Вопросы к коллоквиуму 19 мая 2020

1. Uniprot

  1. Содержание основных полей (DE, OS, OC, FT)
  2. ID и AC, разница между ними
  3. Swiss-Prot и TrEMBL
  4. Протеомы в Uniprot: что такое, какие бывают

2. EMBOSS

  1. Как получить справку по программе (краткую и подробную)?
  2. Как найти программу по ключевому слову в её описании?
  3. Как средствами EMBOSS скачать из подключённого банка полную запись по ID или AC?
  4. Как вырезать из последовательности заданный кусок?
  5. Как добыть из файла с многими последовательностями одну по названию?
  6. Как заставить программу из EMBOSS выдавать результат не в файл, а на stdout?

3. Эволюция и выравнивание

  1. Причины различий последовательностей ДНК у родственных видов.
  2. Гомология последовательностей, нуклеотидов и аминокислот.
  3. Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
  4. Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
  5. Что такое эволюционное выравнивание биологических последовательностей?
  6. Что такое карта сходства двух последовательностей белков (Dot Plot в BLAST)? Какие эволюционные события она описывает?
  7. С чем связана консервативность некоторых аминокислотных остатков белков?
  8. Объясните соотношение дивергенции и конвергенции в эволюции последовательностей белков.

4. Алгоритмы и программы выравнивания

  1. Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
  2. Какие параметры нужно задать алгоритму парного выравнивания?
  3. Как вычисляется вес парного выравнивания последовательностей ДНК?
  4. Как вычисляется вес парного выравнивания последовательностей белков?
  5. Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
  6. Как вычислена матрица весов замен BLOSUM62?
  7. Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
  8. Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
  9. Объясните разницу между локальным и глобальным парным выравниванием.

5. Поиск по сходству последовательностей

Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?

  1. Как E-value выражается через вес выравнивания?
  2. Что такое вес выравнивания в битах и чем он лучше обычного?
  3. За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
  4. Объясните смысл параметров программы BLAST:
    • Word size
    • Compositional adjustment
    • Матрица
    • Штрафы за гэпы
    • Параметры, регулирующие список находок

6. Интерпретация выдачи BLAST

  1. Объясните таблицу находок BLAST и смысл всех параметров в ней
  2. Объясните одно из выравниваний из выдачи BLAST и всю сведения, приведённые перед ним

7. Эволюционные домены

Обязательный вопрос для всех: что такое эволюционный домен?

Откройте страницу домена в Pfam. На ней:

  1. Продемонстрируйте: а) выравнивание последовательностей домена из разных белков и б) доменные архитектуры, содержащие домен.
  2. Покажите два идентификатора данного домена, ID и AC. Продемонстрируйте основные возможности сервиса Pfam:
    • В каких таксонах высокого уровня встречается домен?
    • Что такое выборки seed и full, сколько в них представителей?
    • Известны ли пространственные структуры домена?

Термины

  1. Термины в описании выравнивания
    • Колонка, или позиция, выравнивания
    • Гэпы и индели
    • Консервативная позиция
    • На 90% консервативная позиция.
    • Функционально консервативная позиция
    • Консервативный блок
    • Identity
    • Similarity (Positives)
  2. Гомология (Homology)
  3. Вставка, делеция
  4. Вес выравнивания (Score)
  5. Матрица весов замен (Substitution matrix)
  6. Штраф за гэп (Gap penalty)
  7. Аффинные штрафы за гэпы
  8. Эвристический и точный алгоритм
  9. Названия программ и для чего они применяются:
    • BLAST
    • needle
    • water
    • Muscle
    • Jalview