Программа коллоквиума 5 и 12 мая 2026
1. Uniprot
- UniProtKB: что такое, откуда берется информация, как она организована.
- Структура записи в UniProtKB, cодержание основных полей (DE, OS, OC, FT, DR, CC).
- ID и AC: что такое, зачем нужны.
Протеомы в UniProt: что такое, какие бывают.
UniRef и UniParc: что такое, зачем нужны, как создаются записи.
2. EMBOSS
Будет дано задание, аналогичное одному из упражнений по EMBOSS. Другими словами нужно уметь:
- получать список программ пакета EMBOSS и справку по ним;
- использовать USA для извлечения последовательностей из файла или базы данных, изменения формата последовательности, извлечения её участков и т.д;
- использовать программы EMBOSS в конвейерах;
различать seqret и entret.
Примеры заданий для преподавателей.
3. Эволюция и выравнивание
- Причины различий последовательностей ДНК у родственных видов.
- Гомология последовательностей, нуклеотидов и аминокислотных остатков.
- Как можно выяснить, гомологичны ли данные белки?
- Тождественны ли понятия "гомология белков" и "сходство последовательностей белков"?
- Могут ли гомологичные белки иметь малосходные последовательности?
- Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
- Какая мутация в гене приведёт к делеции одного аминокислотного остатка?
- Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
- Что такое эволюционное выравнивание биологических последовательностей?
- С чем связана консервативность некоторых аминокислотных остатков белков?
- Проверяемо ли экспериментально соответствие выравнивания эволюционному?
- Локальная (непрерывная) эволюция и крупные перестройки последовательности белка:
- Приведите примеры крупных перестроек последовательностей белков
- Какие мутации – локальные или крупные перестройки последовательности – чаще закрепляются в эволюции?
4. Алгоритмы и программы парного выравнивания
- Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
- Какие параметры нужно задать алгоритму парного выравнивания?
- Как вычисляется вес парного выравнивания последовательностей ДНК?
- Как вычисляется вес парного выравнивания последовательностей белков?
- Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
- Объясните разницу между локальным и глобальным парным выравниванием.
5. Интерпретация выравнивания
- Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
- Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
- Можете ли вы привести пример выравнивания, которое не является правильным эволюционным выравниванием, но все-таки имеет некоторый биологический (не эволюционный, а другой) смысл?
- В каком выравнивании будет (в среднем) больше правильных колонок: в оптимальном парном выравнивании двух последовательностей или в выравнивании тех же последовательностей, полученном ограничением из большого множественного выравнивания?
- Чем можно объяснить неравномерность расположения консервативных колонок в множественном выравнивании белков? [пример предоставляется]
- С помощью одной из программ вы получили множественное выравнивание нескольких десятков белков, выберите одно [наиболее] верное утверждение.
- Выравнивание либо полностью правильное, либо полностью неправильное (если белки не являются гомологами).
Выравнивание может быть правильным частично: на одном участке (от позиции M до позиции N) правильное и неправильное на других участках. Поиск правильных участков – задача пользователя программы.
Выравнивание может быть правильным или частично правильным для группы последовательностей, не обязательно для всех. Поиск подмножества последовательностей и правильных участков – задача пользователя.
6. Определение E-value
Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?
7. Поиск по сходству последовательностей
- Как E-value выражается через вес выравнивания?
- Что такое вес выравнивания в битах и чем он лучше обычного?
- За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
- Объясните смысл параметров программы BLAST:
- Word size
- Compositional adjustment
- Матрица и штрафы за гэпы
- Параметры, регулирующие список находок
8. Интерпретация выдачи BLAST
- Объясните таблицу находок BLAST и смысл всех параметров в ней
- Объясните одно из выравниваний из выдачи BLAST и все сведения, приведённые перед ним
9. Множественное выравнивание белков. Алгоритмы и базы данных
- Домены белков.
- Что значит термин «Домен белка»? Что такое «Домен» в базе данных Pfam?
- Многодоменные белки. Доменная архитектура
- Как охарактеризовать гомологичность двух белков с разной доменной архитектурой, но с одним общим доменом?
- Интерпретировать карту локального сходства (dop-plot) двух белков [пример предоставляется]
- База данных Pfam с интерфейсом Interpro. Какую информацию можно получить?
- Эволюционные домены и структурные домены.
- Как выравниваются последовательности белков на основании совмещений пространственных структур.
- Возможности анализа выравнивания в Jalview
- Перечислите основные возможности
- Последовательность действий для группировки последовательностей с одинаковым фрагментом в тех же колонках
- Сравнения выравниваний, построенных разными программами по одному и тому же файлу с последовательностями белков
- Как проверить, совпадают ли выравнивания, построенные разными программами?
- По каким параметрам можно оценивать программы множественного выравнивания последовательностей?
- Что такое блоки совпадающих выравниваний в двух выравниваниях одних и тех же последовательностей?
- Программы множественного выравнивания
- Перечислить несколько программ множественного выравнивания
- Этапы прогрессивного множественного выравнивания последовательностей. Проблемы и возможные пути решения.
10. Термины
- Термины в описании выравнивания
- Колонка, или позиция, выравнивания
- Гэпы и индели
- Консервативная позиция
- На 90% консервативная позиция
- Функционально консервативная позиция
- Identity
- Similarity (Positives)
- Гомология (Homology)
- Вставка, делеция
- Вес выравнивания (Score)
- Матрица весов замен (Substitution matrix)
- Штраф за гэп (Gap penalty)
- Аффинные штрафы за гэпы
- Эвристический и точный алгоритм
- Эволюционный домен белка
- Pfam
- Структурный домен белка
- Названия программ и для чего они применяются:
- BLAST
- needle
- water
- ClustalW
- Muscle
- MAFFT
- Jalview

2024
2023
2022
2021
2020
2019
2018
2017