Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2025

Программа коллоквиума 5 и 12 мая 2026

1. Uniprot

  1. UniProtKB: что такое, откуда берется информация, как она организована.
  2. Структура записи в UniProtKB, cодержание основных полей (DE, OS, OC, FT, DR, CC).
  3. ID и AC: что такое, зачем нужны.
  4. Протеомы в UniProt: что такое, какие бывают.

  5. UniRef и UniParc: что такое, зачем нужны, как создаются записи.

2. EMBOSS

Будет дано задание, аналогичное одному из упражнений по EMBOSS. Другими словами нужно уметь:

Примеры заданий для преподавателей.

3. Эволюция и выравнивание

  1. Причины различий последовательностей ДНК у родственных видов.
  2. Гомология последовательностей, нуклеотидов и аминокислотных остатков.
  3. Как можно выяснить, гомологичны ли данные белки?
  4. Тождественны ли понятия "гомология белков" и "сходство последовательностей белков"?
  5. Могут ли гомологичные белки иметь малосходные последовательности?
  6. Какие бывают мутации в ДНК? Как они сказываются на последовательностях белков?
  7. Какая мутация в гене приведёт к делеции одного аминокислотного остатка?
  8. Может ли точечная мутация в кодирующей последовательности привести к крупному изменению последовательности белка? Обоснуйте.
  9. Что такое эволюционное выравнивание биологических последовательностей?
  10. С чем связана консервативность некоторых аминокислотных остатков белков?
  11. Проверяемо ли экспериментально соответствие выравнивания эволюционному?
  12. Локальная (непрерывная) эволюция и крупные перестройки последовательности белка:
    1. Приведите примеры крупных перестроек последовательностей белков
    2. Какие мутации – локальные или крупные перестройки последовательности – чаще закрепляются в эволюции?

4. Алгоритмы и программы парного выравнивания

  1. Какие вы знаете алгоритмы парного выравнивания и в чём разница между выдаваемыми ими результатами?
  2. Какие параметры нужно задать алгоритму парного выравнивания?
  3. Как вычисляется вес парного выравнивания последовательностей ДНК?
  4. Как вычисляется вес парного выравнивания последовательностей белков?
  5. Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему?
  6. Объясните разницу между локальным и глобальным парным выравниванием.

5. Интерпретация выравнивания

  1. Объясните разницу между оптимальным выравниванием и правильным (эволюционным) выравниванием.
  2. Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
  3. Можете ли вы привести пример выравнивания, которое не является правильным эволюционным выравниванием, но все-таки имеет некоторый биологический (не эволюционный, а другой) смысл?
  4. В каком выравнивании будет (в среднем) больше правильных колонок: в оптимальном парном выравнивании двух последовательностей или в выравнивании тех же последовательностей, полученном ограничением из большого множественного выравнивания?
  5. Чем можно объяснить неравномерность расположения консервативных колонок в множественном выравнивании белков? [пример предоставляется]
  6. С помощью одной из программ вы получили множественное выравнивание нескольких десятков белков, выберите одно [наиболее] верное утверждение.
    1. Выравнивание либо полностью правильное, либо полностью неправильное (если белки не являются гомологами).
    2. Выравнивание может быть правильным частично: на одном участке (от позиции M до позиции N) правильное и неправильное на других участках. Поиск правильных участков – задача пользователя программы.

    3. Выравнивание может быть правильным или частично правильным для группы последовательностей, не обязательно для всех. Поиск подмножества последовательностей и правильных участков – задача пользователя.

6. Определение E-value

Обязательный вопрос для всех: что такое E-value ("Expected") для находок BLAST?

7. Поиск по сходству последовательностей

  1. Как E-value выражается через вес выравнивания?
  2. Что такое вес выравнивания в битах и чем он лучше обычного?
  3. За счёт чего BLAST работает быстрее, чем оптимальное локальное выравнивание запроса со всеми последовательностями банка?
  4. Объясните смысл параметров программы BLAST:
    • Word size
    • Compositional adjustment
    • Матрица и штрафы за гэпы
    • Параметры, регулирующие список находок

8. Интерпретация выдачи BLAST

  1. Объясните таблицу находок BLAST и смысл всех параметров в ней
  2. Объясните одно из выравниваний из выдачи BLAST и все сведения, приведённые перед ним

9. Множественное выравнивание белков. Алгоритмы и базы данных

  1. Домены белков.
    1. Что значит термин «Домен белка»? Что такое «Домен» в базе данных Pfam?
    2. Многодоменные белки. Доменная архитектура
    3. Как охарактеризовать гомологичность двух белков с разной доменной архитектурой, но с одним общим доменом?
  2. Интерпретировать карту локального сходства (dop-plot) двух белков [пример предоставляется]
  3. База данных Pfam с интерфейсом Interpro. Какую информацию можно получить?
  4. Эволюционные домены и структурные домены.
  5. Как выравниваются последовательности белков на основании совмещений пространственных структур.
  6. Возможности анализа выравнивания в Jalview
    1. Перечислите основные возможности
    2. Последовательность действий для группировки последовательностей с одинаковым фрагментом в тех же колонках
  7. Сравнения выравниваний, построенных разными программами по одному и тому же файлу с последовательностями белков
    1. Как проверить, совпадают ли выравнивания, построенные разными программами?
    2. По каким параметрам можно оценивать программы множественного выравнивания последовательностей?
    3. Что такое блоки совпадающих выравниваний в двух выравниваниях одних и тех же последовательностей?
  8. Программы множественного выравнивания
    1. Перечислить несколько программ множественного выравнивания
    2. Этапы прогрессивного множественного выравнивания последовательностей. Проблемы и возможные пути решения.


10. Термины

  1. Термины в описании выравнивания
    • Колонка, или позиция, выравнивания
    • Гэпы и индели
    • Консервативная позиция
    • На 90% консервативная позиция
    • Функционально консервативная позиция
    • Identity
    • Similarity (Positives)
  2. Гомология (Homology)
  3. Вставка, делеция
  4. Вес выравнивания (Score)
  5. Матрица весов замен (Substitution matrix)
  6. Штраф за гэп (Gap penalty)
  7. Аффинные штрафы за гэпы
  8. Эвристический и точный алгоритм
  9. Эволюционный домен белка
  10. Pfam
  11. Структурный домен белка
  12. Названия программ и для чего они применяются:
    • BLAST
    • needle
    • water
    • ClustalW
    • Muscle
    • MAFFT
    • Jalview

2025/2/colloquium (последним исправлял пользователь vakulenko_julia 2026-05-12 10:01:03)