Учебная страница курса биоинформатики,
год поступления 2017
Практикум 10
1. Карта локального сходства двух полипротеинов
- а) Постройте карту локального сходства полипротеина вируса полиомиелита и полипротеина вируса ящура. В отчёт вставьте изображение карты, характеристики двух лучших выравниваний: проценты идентичных и сходных (Positives) остатков, длину участков в обоих белках, число гэпов, вес (Score): обычный (приведён в скобках) и в битах.
- б) Для двух лучших (с максимальным весом) локальных выравниваний определите названия зрелых белков, к которым относятся соответствующие участки полипротеинов.
См. указания.
2. Сравнение веса выравнивания со случайным
Для двух пар белков: предположительно гомологичных (например, из упр. 1 практикума 9) и предположительно неродственных (например, из упр. 3 того же практикума) сравните вес оптимального локального выравнивания с весами оптимальных локальных выравниваний первого белка со 100 случайно перемешанными последовательностями второго. Оптимальное выравнивание ищите программой water при параметрах по умолчанию. В отчёте для каждой пары белков приведите: их идентификаторы, вес выравнивания, медиану и верхний квартиль весов "случайных" выравниваний, результат пересчёта веса в биты, вероятность получить такое же или лучшее выравнивание по случайным причинам. Замечание: вероятность желательно приводить не в степенях двойки, а в более привычном виде, например 3∙10–9 или хотя бы 3e–9.
2а. (* — не обязательно) Эффект смены параметров
Изучите, что произойдёт с результатами предыдущего упражнения при смене параметров программы water. Например, можно увеличить штраф за удлинение инделя ("Gap extension penalty") до 4 или заменить матрицу на BLOSUM90 или BLOSUM30 (в EMBOSS к названиям матриц прибавляется спереди E, например "EBLOSUM90").
2b. (* — не обязательно) Проверка формулы для перевода в биты
Сделайте не 100 перемешиваний, а 1000 и проверьте, действительно ли формула для пересчёта веса в биты даст для уровня верхней 1/8 весов случайных выравниваний значение в 3 бита (хотя бы приближённо).
3. BLAST: поиск гомологов в банке
Возьмите последовательность своего белка. Программой BLAST найдите в банке Swiss-Prot два белка с последовательностями, наиболее сходными с вашей. Для каждой из двух лучших находок приведите: её ID и AC в Swiss-Prot, организм, из которого взят белок, характеристики выравнивания — те же, что в упражнении 1а, плюс обязательно: "Expect" и процент покрытия вашего (исходного) белка выравниванием.
Если (такое изредка бывает) BLAST найдёт не одно, а больше выравниваний с одним и тем же белком, отметьте это и приведите характеристики обоих выравниваний.
Если для вашего белка ничего не находится, возьмите белок из резерва, упомянув это в отчёте.
См. указания.