Учебная страница курса биоинформатики,
год поступления 2023
Вопросы к коллоквиуму 14 мая 2024
1. Uniprot
- UniProtKB: что такое, откуда берется информация, как она организована
- Структура записи в UniProtKB, cодержание основных полей (DE, OS, OC, FT, DR, CC)
- ID и AC: что такое, зачем нужны
Протеомы в UniProt: что такое, какие бывают
UniRef и UniParc: что такое, зачем нужны, как создаются записи
2. EMBOSS
- Как получить справку по программе.
- Что такое USA, привести пример использования.
Что делает опция -filter, в каких случаях её имеет смысл использовать.
3. Эволюция и выравнивание
- Причины различий последовательностей ДНК у родственных видов.
- Гомология последовательностей, нуклеотидов и аминокислот.
- Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
- Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
- Что такое эволюционное выравнивание биологических последовательностей?
- С чем связана консервативность некоторых аминокислотных остатков белков?
- Объясните соотношение дивергенции и конвергенции в эволюции последовательностей белков.
4. Алгоритмы и программы выравнивания
- Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
- Какие параметры нужно задать алгоритму парного выравнивания?
- Как вычисляется вес парного выравнивания последовательностей ДНК?
- Как вычисляется вес парного выравнивания последовательностей белков?
- Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
- Объясните разницу между локальным и глобальным парным выравниванием.
5. Интерпретация выравнивания
- Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
- Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
- Можете ли вы привести пример выравнивания, которое не является правильным эволюционным выравниванием, но все-таки имеет некоторый биологический (не эволюционный, другой) смысл?
- Какое выравнивание имеет больше шансов оказаться правильным (с эволюционной точки зрения), оптимальное парное выравнивание двух белков, или парное выравнивание этих же белков, полученное из неоптимального множественного выравнивания путем удаления других последовательностей.
- С помощью одной из программ вы получили множественное выравнивание нескольких десятков белков, выберите одно [наиболее] верное утверждение.
- Выравнивание либо полностью правильное, либо полностью неправильное (если белки не являются гомологами).
Выравнивание может быть правильным частично: на одном участке (от позиции M до позиции N) правильное и неправильное на других участках. Поиск правильных участков – задача пользователя программы.
Выравнивание может быть правильным или частично правильным для группы последовательностей, не обязательно для всех. Поиск подмножества последовательностей и правильных участков – задача пользователя.
6. Определение E-value
Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?
7. Поиск по сходству последовательностей
- Как E-value выражается через вес выравнивания?
- Что такое вес выравнивания в битах и чем он лучше обычного?
- За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
- Объясните смысл параметров программы BLAST:
- Word size
- Compositional adjustment
- Матрица и штрафы за гэпы
- Параметры, регулирующие список находок
8. Интерпретация выдачи BLAST
- Объясните таблицу находок BLAST и смысл всех параметров в ней
- Объясните одно из выравниваний из выдачи BLAST и все сведения, приведённые перед ним
9. Множественное выравнивание белков. Эволюция, гомология и сходство последовательностей
- Как соотносится последовательность белка и химия молекулы этого белка [Л11, стр.12]
- Локальная эволюция (непрерывная) и крупные перестройки последовательности белка [Л11, стр.10-11, 16; Л12, стр. 5-7]
- Что такое непрерывная эволюция
- Какая мутация в гене приведёт к делеции одного аминокислотного остатка
- Приведите примеры крупных перестроек последовательностей белков
- Как происходят крупные перестройки - постепенно или единовременно
- Какие мутации – локальные или крупные перестройки последовательности - чаще закрепляются в эволюции. Роль отбора [Л11, стр.10]
- Чем можно объяснить неравномерность расположения консервативных колонок в множественном выравнивании белков [пример предоставляется].
- Отражение эволюции в множественном выравнивании белков.
- Эволюционное выравнивание: какие аминокислотные остатки стоят в одной колонке? Проверяемо ли экспериментально соответствие выравнивания эволюционному? [Л11, стр.14-15]
- Гомологичные белки. Гомология и сходство последовательностей. [Л11, стр.12]
- Могут ли гомологичные белки иметь малосходные последовательности
- Можно ли говорить и писать, что белки с данными последовательностями гомологичны на 50%
- Можно ли говорить и писать, что последовательности белков сходны на 50%
- Чем обосновывается гомологичность белков.
- Тождественны ли понятия гомология белков и сходство последовательностей белков.
10. Множественное выравнивание белков. Алгоритмы и базы данных
- Домены белков. [Л11, стр. 31; Л12, стр. 5-7]
- Что значит термин «Домен» белка и «Домен» из базы данных Pfam
- Многодоменные белки. Доменная архитектура [Л12, стр. 5-7]
- Как охарактеризовать гомологичность двух белков с разной доменной архитектурой, но с одним общим доменом
- Интерпретировать карту локального сходства (dop-plot) двух белков [Л11, стр. 40 ; пример предоставляется]
- База данных Pfam с интерфейсом Interpro. Какую информацию можно получить [КР-11, вопросы; продемонстрировать]
- Эволюционные домены и структурные домены. [Л11, стр. 33-34; Л12, стр. 38-42]
- Как выравниваются последовательности белков на основании совмещений пространственных структур.
- Возможности анализа выравнивания в Jalview [ДЗ пояснения]
- Перечислите возможности
- Последовательность действий для группировки последовательностей с одинаковым фрагментом в тех же колонках
- “Правильное” (свидетельствующее о гомологичности) и неправильное (не может использоваться для обоснования гомологичности) множественное выравнивание белков [КР-12; пример представляется]
- Сравнения выравниваний, построенных разными программами по одному и тому же файлу с последовательностями белков [Л12, стр. 11-12]
- Как проверить совпадают ли выравнивания, построенные разными программами [пример предоставляется]
- Банки эталонных выравниваний [Л12, стр. 11]
- По каким параметрам можно оценивать программы множественного выравнивания последовательностей
- Что такое блоки совпадающих выравниваний в двух выравниваниях одних и тех же последовательностей. [КР12; пояснения к заданию прак. 12; Л12, стр. 30-34; пример предоставляется]
- Программы множественного выравнивания
- Перечислить несколько программ множественного выравнивания [Л12, стр. 12-13]
- Этапы прогрессивного множественного выравнивания последовательностей. Проблемы и возможные пути решения. [Л12, стр. 15-22]
11. Термины
- Термины в описании выравнивания
- Колонка, или позиция, выравнивания
- Гэпы и индели
- Консервативная позиция
- На 90% консервативная позиция
- Функционально консервативная позиция
- Identity
- Similarity (Positives)
- Гомология (Homology)
- Вставка, делеция
- Вес выравнивания (Score)
- Матрица весов замен (Substitution matrix)
- Штраф за гэп (Gap penalty)
- Аффинные штрафы за гэпы
- Эвристический и точный алгоритм
- Эволюционный домен белка
- Pfam
- Структурный домен белка
- Названия программ и для чего они применяются:
- BLAST
- needle
- water
- ClustalW
- Muscle
- MAFFT
- Jalview
Вопросы по множественному выравниванию (практикумы 11 и 12) будут уточнены. Пока открыты прошлогодние