Учебная страница курса биоинформатики,
год поступления 2016
Билет включает по одному вопросу из каждой темы. Вопросы 1.1 и 1.2 обязательны для всех.
Вопросы
Тема 1: аминокислоты
- Привести однобуквенные обозначения пяти аминокислотных остатков, указанных преподавателем
- Привести три примера групп аминокислотных остатков, сходных по физико-химическим свойствам И имеющих положительные веса в матрице BLOSUM62
- Логарифм отношения правдоподобия. Объясните на примере "веса дружелюбности" в зрительном зале или матрицы BLOSUM62
Тема 2: биологический смысл выравнивания
- Объясните каким образом правильное выравнивание описывает эволюцию
- В чем разница между биологическим (правильным) выравниванием и оптимальным выравниванием, строящимся с помощью алгоритма?
- Что такое блок (блок достоверного выравнивания) во множественном выравнивании и как его найти? Основные условия на блок. Какой биологический смысл в блоке?
- Сравнение двух выравниваний одних и тех же последовательностей: что значит, что выравнивания в данной позиции совпадают? не совпадают? Приведите примеры.
Тема 3: Алгоритм парного выравнивания
- Объясните, как вычисляется вес парного выравнивания
- Объясните термины: длина выравнивания, позиция, гэп, индель
- Объясните, что такое линейные и аффинные штрафы за индели. Какие штрафы предпочтительнее использовать с биологической точки зрения и почему
- Объясните граф "Манхэттен с Бродвеями" и как он связан с парным выравниванием
- Объясните алгоритм динамического программирования на примере оптимального пути через Манхэттен или парного выравнивания
- Что такое концевые гэпы? Как и зачем их ставят нулевыми?
Тема 4: BLAST
- Продемонстрируйте результаты работы программы BLAST для вашего белка. Покажите проверяющему страницу с параметрами BLAST и страницу с результатом
- Объясните E-value на примере попугаев или находок BLAST. Назовите авторов статьи, в которой предложена и доказана формула для вычисления E-value в BLAST
- Объясните проверяющему одно из ниже следующих
- использованные параметры и их смысл
- Графическое изображение результатов, таблицу находок и смысл всех параметров находок
- Одно из выравниваний и все параметры, указанные в нем
- Объясните возможности скачивания результатов BLAST
- Объясните, что такое bit-score и чем он лучше обычного?
Тема 5: Множественное выравнивание
- Объясните, что такое эвристический алгоритм и в чем его отличие от точного. Назовите три программы.
- Объясните разницу между иерархическим алгоритмом выравнивания и блочным.
- Назовите основные этапы иерархического выравнивания и объясните идеи алгоритмов на каждом этапе.
- Объясните, что такое домен и доменная архитектура. Что является единицей хранения в БД Pfam?
Тема 6: Приблизительные расчеты
- Сравните число операций (и процессорное время) на этапе построении направляющего дерева и на этапе собственно построения множественного выравнивания
- Оцените число последовательностей, отбираемых для выравнивания программой BLAST, при длине слова W = 6, для отбора последовательности нужно два слова на одной диагонали с расстоянием между ними не более A = 20. Банк Uniprot содержит около 100 млн последовательностей, средняя длина 340 а.к.о.
Термины:
- % identities
- % positives
- gap column
- gap
- insertion
- deletion
- indel
- Вес выравнивания (score)
- Bit-score
- E-value
- Матрица сходства (матрица замен)
- BLOSUM62
- Gap pennalty
- Аффинные гэпы
- Gap opening penalty
- Gap extention penalty
- needle
- water
- Muscle
- Mafft
- ClustalO
ProbCons
- T-coffee