Учебная страница курса биоинформатики,
год поступления 2022
Вопросы к коллоквиуму 16 мая 2023
1. Uniprot
- UniProtKB: что такое, откуда берется информация, как она организована
- Структура записи в UniProtKB, cодержание основных полей (DE, OS, OC, FT, DR, CC)
- ID и AC: что такое, зачем нужны
Протеомы в UniProt: что такое, какие бывают
UniRef и UniParc: что такое, зачем нужны, как создаются записи
2. EMBOSS
- Как получить справку по программе.
- Что такое USA, привести пример использования.
Что делает опция -filter, в каких случаях её имеет смысл использовать.
3. Эволюция и выравнивание
- Причины различий последовательностей ДНК у родственных видов.
- Гомология последовательностей, нуклеотидов и аминокислот.
- Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
- Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
- Что такое эволюционное выравнивание биологических последовательностей?
- С чем связана консервативность некоторых аминокислотных остатков белков?
- Объясните соотношение дивергенции и конвергенции в эволюции последовательностей белков.
4. Алгоритмы и программы выравнивания
- Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
- Какие параметры нужно задать алгоритму парного выравнивания?
- Как вычисляется вес парного выравнивания последовательностей ДНК?
- Как вычисляется вес парного выравнивания последовательностей белков?
- Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
- Объясните разницу между локальным и глобальным парным выравниванием.
5. Интерпретация выравнивания
- Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
- Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
- Можете ли вы привести пример выравнивания, которое не является правильным эволюционным выравниванием, но все-таки имеет некоторый биологический (не эволюционный, другой) смысл?
- Какое выравнивание имеет больше шансов оказаться правильным (с эволюционной точки зрения), оптимальное парное выравнивание двух белков, или парное выравнивание этих же белков, полученное из неоптимального множественного выравнивания путем удаления других последовательностей.
- С помощью одной из программ вы получили множественное выравнивание нескольких десятков белков, выберите одно [наиболее] верное утверждение.
- Выравнивание либо полностью правильное, либо полностью неправильное (если белки не являются гомологами).
Выравнивание может быть правильным частично: на одном участке (от позиции M до позиции N) правильное и неправильное на других участках. Поиск правильных участков – задача пользователя программы.
Выравнивание может быть правильным или частично правильным для группы последовательностей, не обязательно для всех. Поиск подмножества последовательностей и правильных участков – задача пользователя.
6. Определение E-value
Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?
7. Поиск по сходству последовательностей
- Как E-value выражается через вес выравнивания?
- Что такое вес выравнивания в битах и чем он лучше обычного?
- За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
- Объясните смысл параметров программы BLAST:
- Word size
- Compositional adjustment
- Матрица и штрафы за гэпы
- Параметры, регулирующие список находок
8. Интерпретация выдачи BLAST
- Объясните таблицу находок BLAST и смысл всех параметров в ней
- Объясните одно из выравниваний из выдачи BLAST и все сведения, приведённые перед ним
9. Множественное выравнивание белков
- Локальные изменения и крупные перестройки в последовательности белков в процессе эволюции.
- Роль отбора.
- Построение и интерпретация Dotplot двух белков. [подобрать примеры]
- Эволюционные домены и доменная архитектура белка.
- “Идеальное” множественное выравнивание последовательностей гомологичных белков: какие аминокислотные остатки стоят в одно колонке.
- Выравнивание по совмещению пространственных структур белков.
- Какое выравнивание их двух парных более точное:
- выравнивание двух последовательностей в составе множественного выравнивания
- их же выравнивание, построенное программой парного выравнивания.
- База данных Pfam. Единица хранения. Доступная информация.
- Как сравнить два выравнивания одних и тех же белков, построенные разными программами множественного выравнивания.
- Программы множественного выравнивания, перечислить две-три
- Идея и проблемы прогрессивного (иерархического) множественного выравнивания
10. Термины
- Термины в описании выравнивания
- Колонка, или позиция, выравнивания
- Гэпы и индели
- Консервативная позиция
- На 90% консервативная позиция
- Функционально консервативная позиция
- Identity
- Similarity (Positives)
- Гомология (Homology)
- Вставка, делеция
- Вес выравнивания (Score)
- Матрица весов замен (Substitution matrix)
- Штраф за гэп (Gap penalty)
- Аффинные штрафы за гэпы
- Эвристический и точный алгоритм
- Эволюционный домен белка
- Pfam
- Структурный домен белка
- Названия программ и для чего они применяются:
- BLAST
- needle
- water
- CustalW
- Muscle
- MAFFT
- Jalview