Учебная страница курса биоинформатики,
год поступления 2019
Вопросы к коллоквиуму 19 мая 2020
1. Uniprot
- Содержание основных полей (DE, OS, OC, FT)
- ID и AC, разница между ними
- Swiss-Prot и TrEMBL
- Протеомы в Uniprot: что такое, какие бывают
2. EMBOSS
- Как получить справку по программе (краткую и подробную)?
- Как найти программу по ключевому слову в её описании?
- Как средствами EMBOSS скачать из подключённого банка полную запись по ID или AC?
- Как вырезать из последовательности заданный кусок?
- Как добыть из файла с многими последовательностями одну по названию?
- Как заставить программу из EMBOSS выдавать результат не в файл, а на stdout?
3. Эволюция и выравнивание
- Причины различий последовательностей ДНК у родственных видов.
- Гомология последовательностей, нуклеотидов и аминокислот.
- Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
- Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
- Что такое эволюционное выравнивание биологических последовательностей?
- Что такое карта сходства двух последовательностей белков (Dot Plot в BLAST)? Какие эволюционные события она описывает?
- С чем связана консервативность некоторых аминокислотных остатков белков?
- Объясните соотношение дивергенции и конвергенции в эволюции последовательностей белков.
4. Алгоритмы и программы выравнивания
- Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
- Какие параметры нужно задать алгоритму парного выравнивания?
- Как вычисляется вес парного выравнивания последовательностей ДНК?
- Как вычисляется вес парного выравнивания последовательностей белков?
- Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
- Как вычислена матрица весов замен BLOSUM62?
- Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
- Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
- Объясните разницу между локальным и глобальным парным выравниванием.
5. Поиск по сходству последовательностей
Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?
- Как E-value выражается через вес выравнивания?
- Что такое вес выравнивания в битах и чем он лучше обычного?
- За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
- Объясните смысл параметров программы BLAST:
- Word size
- Compositional adjustment
- Матрица
- Штрафы за гэпы
- Параметры, регулирующие список находок
6. Интерпретация выдачи BLAST
- Объясните таблицу находок BLAST и смысл всех параметров в ней
- Объясните одно из выравниваний из выдачи BLAST и всю сведения, приведённые перед ним
7. Эволюционные домены
Обязательный вопрос для всех: что такое эволюционный домен?
Откройте страницу домена в Pfam. На ней:
- Продемонстрируйте: а) выравнивание последовательностей домена из разных белков и б) доменные архитектуры, содержащие домен.
- Покажите два идентификатора данного домена, ID и AC. Продемонстрируйте основные возможности сервиса Pfam:
- В каких таксонах высокого уровня встречается домен?
- Что такое выборки seed и full, сколько в них представителей?
- Известны ли пространственные структуры домена?
Термины
- Термины в описании выравнивания
- Колонка, или позиция, выравнивания
- Гэпы и индели
- Консервативная позиция
- На 90% консервативная позиция.
- Функционально консервативная позиция
- Консервативный блок
- Identity
- Similarity (Positives)
- Гомология (Homology)
- Вставка, делеция
- Вес выравнивания (Score)
- Матрица весов замен (Substitution matrix)
- Штраф за гэп (Gap penalty)
- Аффинные штрафы за гэпы
- Эвристический и точный алгоритм
- Названия программ и для чего они применяются:
- BLAST
- needle
- water
- Muscle
- Jalview