Учебная страница курса биоинформатики,
год поступления 2012
5. Парное выравнивание белков
Задание №1
В этом задании надо будет получить несколько коротких фрагментов (по 20 аминокислот) из искусственно смоделированного мутанта вашего белка. Это следует сделать с помощью специально написанного скрипта evolve_protein.pl; инструкции по его запуску и описание модели эволюции приведены в подсказках.
ПРИМЕЧАНИЕ: Тут и далее под "вашим" белком, если не указано явно иначе, является белок из B. subtilis, с которым вы работали в первом семестре и будете работать далее.
Получите 3 мутантных пептида со следующими эволюционными параметрами:
Параметр |
Мутант №1_1 |
Мутант №2_1 |
Мутант №3_1 |
Вероятность изменения остатка (моделирующая "ошибку" ДНК-полимеразы) |
0.6 |
0.6 |
0.4 |
Вероятность замены остатка в случае, если данная позиция будет изменена |
0.6 |
0.8 |
0.8 |
Зафиксируйте последовательности каждого из полученных мутантов (лучше всего сохранить полные выдачи скрипта).
Настройте цвета отображения аминокислот в JalView (советы по использованию JalView есть в подсказках к этому практикуму и в подсказках А.В. Алексеевского), сгруппировав их по свойствам бокового радикала; сохраните схему цветовых настроек (в результате у вас, например, все положительно заряженные аминокислоты должны окрашиваться одним цветом, отрицательно заряженные другим, сильно гидрофобные - третьим, и т.п.). !!! Важно: научитесь настраивать окраску самостоятельно, не используя какую-то из встроенных цветовых схем
Создайте 3 файла в FASTA-формате, содержащие последовательность Вашего белка, а также последовательности каждого из соответствующих мутантов. Последовательно для каждого из них сделайте следующее:
Откройте файл в JalView.
Создайте и сохраните новый проект JalView.
- Попытайтесь найти то место в Вашем исходном белке, из которого был вырезан мутированный фрагмент, и вручную выровнять его.
Для полученного выравнивания вычислите: % идентичности, % сходства (по выбранным функциональным группам) и вес по матрице BLOSUM62 (матрицу BLOSUM62 из оригинальной статьи (Henikoff&Henikoff, 1992) можно посмотреть в презентации к этому заданию, а также в текстовом виде).
Совет: если не можете легко найти то место белка, с которым должен выравниваться мутантный пептид, можно воспользоваться методом, который, кстати, использует алгоритм BLAST (с ним вы познакомитесь уже очень скоро). Суть в том, чтобы искать в исходной последовательности коротенькие фрагменты из пептида – например, фрагменты по 3 остатка. Перебирая все возможные идущие подряд тройки аминокислот, можно найти нужное место (о том, как искать в JalView, говорится в подсказках).
Опишите в протоколе Ваши результаты для каждого из трех белков и сформулируйте, на что и как повлияли заданные параметры модели эволюции. Вставьте в протокол рисунки, показывающие область выравнивания для каждого случая (на рисунках обязательно укажите номера остатков, отвечающих началам и концам фрагмента в каждой последовательности).
Опишите в протоколе, как согласуются результаты трех мер качества полученных выравниваний.
Задание №2
Постройте выравнивание последовательностей вашего белка и его предполагаемых ортологов или гомологов (всего 3 последоватетельности), найденных на предыдущих занятиях. В протоколе оцените попарное сходство белков по принятым критериям сходства.
- Создайте файл в формате fasta с тремя последовательностями.
Откройте его с помощью JalView
- Выровняйте все три последовательности с помощью программы Muscle:
Меню Web services => Alignment => Muscle with default
- Результат появится в новом окне
- Получите информацию о каждой из трех пар последовательностей
Выделите пару последовательностей в JalView
Курсор - на выделение, правая кнопка мыши => Selection => Output to text box => Fasta (чтобы сохранить в формате fasta) и скопировать выравнивание из окна в файл
- Используйте команду infoalign из EMBOSS для получения нужной информации
- (дополнительное задание) Опишите команду infoalign на нашей странице wiki для EMBOSS
- Раскрасьте выравнивание (всех трех последовательностей) по схеме, называемой ClustalX. Выберите опцию "Above identity ntreshold" для того, чтобы окрашивать только те позиции (т.е. колонки выравнивания), в которых превышен процент совпадающих букв. Подберите порог "identity treshold" так, чтобы окрашивались позиции, в которых, как минимум, две совпадающие буквы
Сохраните проект JalViw, т.е. все окна в текущем состоянии (формат - .jar).
- В главном окне Save Project
Задание №3 (*, необязательное)
Используйте скрипт evolve_protein.pl для моделирования более близкой к реальности ситуации. Частота ошибок ДНК-полимеразы у Escherichia coli может быть оценена как 10-4-10-5 на нуклеотид (см., например, тут). Треть таких мутаций затрагивают третий кодон в аминокислоте, а значит чуть менее чем треть мутаций будут синонимичными. Повышение точности копирования ДНК достигается за счет специальных систем репарации, которые "чинят" поломки сразу же после возникновения; мы же предположим, что репарация не работает.
Параметр |
Мутант №3_1 |
Мутант №3_2 |
Мутант №3_3 |
Вероятность изменения остатка (моделирующая "ошибку" ДНК-полимеразы) |
0.0001 |
0.0001 |
0.00001 |
Вероятность замены остатка в случае, если данная позиция будет изменена |
0.8 |
0.8 |
0.8 |
Количество поколений |
1000 |
10000 |
10000 |
Попробуйте для каждого мутанта выполнить то же самое, что делали в задании №1 для коротких пептидов, но ограничьтесь подсчетом меры % идентичности для каждого из выравниваний. В протоколе опишите, как значения варьированных параметров влияют на качество выравнивания. Подсчитайте, сколько времени займет производство такого количества поколений (оцените время от деления до деления у E.coli в 30 минут).
Что нужно для зачетного задания
К следующему занятию файлы с результатами практикума №5 должны лежать в директории ...block2/credits и их имена должны начинаться с вашей фамилии, как всегда. Их наличие будет проверено и будет влиять на баллы.
Результаты по практикумам 5 и 6 должны быть представлены на вашем сайте. Срок - до практикума 7. Что именно должно быть на сайте, будет указано на стр. практикума 6. Противоречие с текстом ниже будет устранено. Своевременно или несколько позже ААл.
По результатам обсуждения мы решили, что за практикумы 5 и 6 будет отдельное зачетное задание, по сути являющееся комбинацией результатов обоих практикумов, их сопоставления и т.п. В целях промежуточного контроля мы будем проверять, проделана ли работа по каждому практикуму.
DEADLINE по наличию протокола с результатом практикума 5 в директории ...block2/credits:
- Для группы 2 (лекция 13 марта) = 20 марта
- Для группы 1 (лекция 15 марта) = 22 марта