Занятие 9. Паттерны и банк PROSITE.

Рабочая директория — H:\Term2\Block3\Practice9.
Формат отчета — HTML-страничка со ссылкой со страницы второго семестра.
Срок — утро дня следующего занятия.

Упражнение 1. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot

Рассмотрите в JalView множественное выравнивание, полученное при выполнении упражнения 1 прошлого занятия (то есть выравнивание вашего белка и его родственников). Выберите фрагмент выравнивания длиной 8–20 а.о. для дальнейшего исследования. Желательно, чтобы от трети до половины колонок фрагмента были консервативны на 70–100%; будет поучительно, если попадутся колонки с гэпами.

Изображение выбранного фрагмента выравнивания вставьте в отчёт (как сделать такое изображение, см. в подсказке).

Рассмотрите выбранный фрагмент множественного выравнивания. Создайте три паттерна, запишите их в таблицу, см. ниже.

  1. Первый паттерн в точности является фрагментом последовательности вашего белка (то есть только одной из последовательностей выравнивания).
  2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки вашей выборки, и только их (другой вопрос, что паттерн будет находить в действительности:).
  3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими. Стремиться надо к тому, чтобы паттерн находил всех близких родственников вашего белка и не находил неродственные белки.
    Мы не ждём от вас, что эта цель будет достигнута! Разве что повезёт. Тем не менее усилия в данном направлении будут оцениваться.
В этом упражнении надо показать умение использовать основные элемента синтаксиса паттернов:
[ALK] — в данной позиции разрешены только те остатки, которые перечислены в квадратных скобках;
x(3) — интервал в 3 любых остатка;
x(2,5) — интервал от двух до пяти любых остатков.

Подробнее о правилах написания патернов см. Pattern syntax. Как "усилить" или "ослабить" паттерн см. в подсказке.

Проведите поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов. Это можно сделать на сайте PROSITE (http://prosite.expasy.org/) или на kodomo, см. указания.

По результатам упражнения заполните табличку следующего вида:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
Фрагмент последовательности      
Сильный      
Слабый      

 

(*) дополнительно

Оцените для "слабого" паттерна, сколько раз он встретится в случайном банке размером в Swiss-Prot (приведите не только результат, но и объяснение, как он получен). Проверьте, запустив поиск паттерна в перемешанном банке (shuffled в окошке "randomize databases"). Сравните с неперемешанным банком и прокомментируйте результат.

Упражнение 2. Найти и описать все мотивы в вашем белке по данным БД Prosite

Найдите в последовательности вашего белка все мотивы, описанные в Prosite, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн Специфична ли подпись? Сколько мотивов нашлось в белке?
Например,
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 12
             
             

 


Формат отчета

HTML-страничка, названная "Паттерны и профили".
  1. Заголовок "Создание паттернов аминокислотных последовательностей"
  2. Заголовок "Все описанные в PROSITE мотивы в заданном белке XXXX_BACSU"