Занятие 10. Паттерны и банк Prosite
Ваша рабочая директория H:\Term2\Practice10,
в ней храните все рабочие файлы.
Формат отчета HTML-страничка со ссылкой со страницы второго семестра
(подробнее см. внизу этой страницы).
Срок — утро дня следующего занятия.
Упражнение 1. Создать паттерны по множественному выравниванию и провести
поиск по паттернам в банке данных Swiss-Prot
Рассмотрите в GeneDoc множественное выравнивание,
полученное при выполнении упражнения 2 прошлого занятия
(то есть выравнивание вашего белка и его родственников).
Выберите фрагмент выравнивания длиной 8–20 а.о. для дальнейшего
исследования. Желательно, чтобы от трети до половины колонок фрагмента
были консервативны на 70–100%, будет поучительно, если попадется
пропуск ближе к одному из концов фрагмента.
Картинку с изображением выбранного фрагмента выравнивания прикрепите к отчету
(см. указания).
Рассмотрите выбранный фрагмент множественного выравнивания.
Создайте 3 паттерна, запишите их в таблицу, см. ниже.
- Первый паттерн в точности является фрагментом последовательности вашего
белка (то есть только одной из последовательностей выравнивания).
- Второй ("сильный") паттерн надо постараться построить так,
чтобы он распознавал все белки вашей выборки, и только их
(другой вопрос, что паттерн будет находить в действительности:).
- Третий ("слабый") паттерн надо создать на основе второго,
сделав требования к последовательности более мягкими. Стремиться надо
к тому, чтобы паттерн находил всех близких родственников вашего белка
и не находил неродственные белки.
Мы не ждём от вас, что эта цель будет достигнута! Разве что повезёт.
Тем не менее усилия в данном направлении будут оцениваться.
В этом упражнении надо показать умение использовать основные
элемента синтаксиса паттернов:
[ALK] в данной позиции разрешены только те остатки, которые
перечислены в квадратных скобках;
x(3) интервал в 3 любых остатка;
возможный вариант: x(2,5) интервал от двух до пяти любых остатков.
Подробнее о правилах написания патернов см.
Pattern syntax rules.
Как "усилить" или "ослабить" паттерн см. в подсказке.
Проведите поиск последовательностей банка Swiss-Prot, включающих
мотивы, соответствующие каждому из полученных паттернов,
см. подсказку.
По результатам упражнения заполните табличку следующего вида:
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
|
|
|
Сильный |
|
|
|
Слабый |
|
|
|
Упражнение 2. Найти и описать все мотивы в Вашем белке (по данным БД
PROSITE)
Найдите в последовательности вашего белка все мотивы, описанные
в PROSITE, в том числе неспецифичные (часто встречающиеся).
По результатам поиска составьте следующую таблицу.
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
Например, |
PS00008 |
MYRISTYL |
Сайт N-миристоилирования |
паттерн |
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} |
неспецифична |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Формат отчета
Формат HTML-страничка, названная "Паттерны и профили".
- Заголовок "Создание паттернов аминокислотных последовательностей"
- Ссылка на картинку, полученную из GeneDoc и изображающую выбранный
фрагмент выравнивания, по которому строились паттерны.
Названия последовательностей должны представлять собой ID белков!
- Таблица к упр. 1 (таблица должна иметь заголовок)
- Краткий комментарий к таблице, в котором объясняется, что и зачем делалось,
а также описаны возможные наблюдения.
Например, указано, нашлись ли последовательности с названием,
явно отличающимся от названия Вашего
белка; если да, то с каким?
Любые другие интересные наблюдения (в частности, сравнение
с выдачей программмы BLAST) будут оценены по достоинству.
- Заголовок "Все описанные в PROSITE мотивы в заданном белке
XXXX_BACSU"
|