Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

5. Парное выравнивание белков

Задание №1

В этом задании надо будет получить несколько коротких фрагментов (по 20 аминокислот) из искусственно смоделированного мутанта вашего белка. Это следует сделать с помощью специально написанного скрипта evolve_protein.pl; инструкции по его запуску и описание модели эволюции приведены в подсказках.

ПРИМЕЧАНИЕ: Тут и далее под "вашим" белком, если не указано явно иначе, является белок из B. subtilis, с которым вы работали в первом семестре и будете работать далее.

Получите 3 мутантных пептида со следующими эволюционными параметрами:

Параметр

Мутант №1_1

Мутант №2_1

Мутант №3_1

Вероятность изменения остатка (моделирующая "ошибку" ДНК-полимеразы)

0.6

0.6

0.4

Вероятность замены остатка в случае, если данная позиция будет изменена

0.6

0.8

0.8

Зафиксируйте последовательности каждого из полученных мутантов (лучше всего сохранить полные выдачи скрипта).

Настройте цвета отображения аминокислот в JalView (советы по использованию JalView есть в подсказках к этому практикуму и в подсказках А.В. Алексеевского), сгруппировав их по свойствам бокового радикала; сохраните схему цветовых настроек (в результате у вас, например, все положительно заряженные аминокислоты должны окрашиваться одним цветом, отрицательно заряженные другим, сильно гидрофобные - третьим, и т.п.). !!! Важно: научитесь настраивать окраску самостоятельно, не используя какую-то из встроенных цветовых схем

Создайте 3 файла в FASTA-формате, содержащие последовательность Вашего белка, а также последовательности каждого из соответствующих мутантов. Последовательно для каждого из них сделайте следующее:

  1. Откройте файл в JalView.

  2. Создайте и сохраните новый проект JalView.

  3. Попытайтесь найти то место в Вашем исходном белке, из которого был вырезан мутированный фрагмент, и вручную выровнять его.
  4. Для полученного выравнивания вычислите: % идентичности, % сходства (по выбранным функциональным группам) и вес по матрице BLOSUM62 (матрицу BLOSUM62 из оригинальной статьи (Henikoff&Henikoff, 1992) можно посмотреть в презентации к этому заданию, а также в текстовом виде).

Совет: если не можете легко найти то место белка, с которым должен выравниваться мутантный пептид, можно воспользоваться методом, который, кстати, использует алгоритм BLAST (с ним вы познакомитесь уже очень скоро). Суть в том, чтобы искать в исходной последовательности коротенькие фрагменты из пептида – например, фрагменты по 3 остатка. Перебирая все возможные идущие подряд тройки аминокислот, можно найти нужное место (о том, как искать в JalView, говорится в подсказках).

Опишите в протоколе Ваши результаты для каждого из трех белков и сформулируйте, на что и как повлияли заданные параметры модели эволюции. Вставьте в протокол рисунки, показывающие область выравнивания для каждого случая (на рисунках обязательно укажите номера остатков, отвечающих началам и концам фрагмента в каждой последовательности).

Опишите в протоколе, как согласуются результаты трех мер качества полученных выравниваний.

Задание №2

Постройте выравнивание последовательностей вашего белка и его предполагаемых ортологов или гомологов (всего 3 последоватетельности), найденных на предыдущих занятиях. В протоколе оцените попарное сходство белков по принятым критериям сходства.

  1. Создайте файл в формате fasta с тремя последовательностями.
  2. Откройте его с помощью JalView

  3. Выровняйте все три последовательности с помощью программы Muscle:
    • Меню Web services => Alignment => Muscle with default

    • Результат появится в новом окне
  4. Получите информацию о каждой из трех пар последовательностей
    • Выделите пару последовательностей в JalView

    • Курсор - на выделение, правая кнопка мыши => Selection => Output to text box => Fasta (чтобы сохранить в формате fasta) и скопировать выравнивание из окна в файл

    • Используйте команду infoalign из EMBOSS для получения нужной информации
    • (дополнительное задание) Опишите команду infoalign на нашей странице wiki для EMBOSS
  5. Раскрасьте выравнивание (всех трех последовательностей) по схеме, называемой ClustalX. Выберите опцию "Above identity ntreshold" для того, чтобы окрашивать только те позиции (т.е. колонки выравнивания), в которых превышен процент совпадающих букв. Подберите порог "identity treshold" так, чтобы окрашивались позиции, в которых, как минимум, две совпадающие буквы
  6. Сохраните проект JalViw, т.е. все окна в текущем состоянии (формат - .jar).

    • В главном окне Save Project

Задание №3 (*, необязательное)

Используйте скрипт evolve_protein.pl для моделирования более близкой к реальности ситуации. Частота ошибок ДНК-полимеразы у Escherichia coli может быть оценена как 10-4-10-5 на нуклеотид (см., например, тут). Треть таких мутаций затрагивают третий кодон в аминокислоте, а значит чуть менее чем треть мутаций будут синонимичными. Повышение точности копирования ДНК достигается за счет специальных систем репарации, которые "чинят" поломки сразу же после возникновения; мы же предположим, что репарация не работает.

Параметр

Мутант №3_1

Мутант №3_2

Мутант №3_3

Вероятность изменения остатка (моделирующая "ошибку" ДНК-полимеразы)

0.0001

0.0001

0.00001

Вероятность замены остатка в случае, если данная позиция будет изменена

0.8

0.8

0.8

Количество поколений

1000

10000

10000

Попробуйте для каждого мутанта выполнить то же самое, что делали в задании №1 для коротких пептидов, но ограничьтесь подсчетом меры % идентичности для каждого из выравниваний. В протоколе опишите, как значения варьированных параметров влияют на качество выравнивания. Подсчитайте, сколько времени займет производство такого количества поколений (оцените время от деления до деления у E.coli в 30 минут).

Что нужно для зачетного задания

К следующему занятию файлы с результатами практикума №5 должны лежать в директории ...block2/credits и их имена должны начинаться с вашей фамилии, как всегда. Их наличие будет проверено и будет влиять на баллы.

Результаты по практикумам 5 и 6 должны быть представлены на вашем сайте. Срок - до практикума 7. Что именно должно быть на сайте, будет указано на стр. практикума 6. Противоречие с текстом ниже будет устранено. Своевременно или несколько позже :) ААл.

По результатам обсуждения мы решили, что за практикумы 5 и 6 будет отдельное зачетное задание, по сути являющееся комбинацией результатов обоих практикумов, их сопоставления и т.п. В целях промежуточного контроля мы будем проверять, проделана ли работа по каждому практикуму.

DEADLINE по наличию протокола с результатом практикума 5 в директории ...block2/credits: