Самый простой способ создать отчет в формате HTML — это скопировать страничку задания, а затем ее отредактировать!

Занятие 9. Мотивы, паттерны и профили

Упражнение 1. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot

Импортируйте в Genedoc множественное выравнивание, полученное на прошлом занятии с помощью muscle.
Выберите фрагмент выравнивания длиной 8–20 а.о. для дальнейшего исследования. Желательно, чтобы от трети до половины колонок фрагмента были консервативны на 70–100%, будет поучительно, если попадется пропуск ближе к одному из концов фрагмента.
Картинку с изображением выбранного фрагмента выравнивания прикрепите к отчету.

Рассмотрите выбранный Вами фрагмент множественного выравнивания. Создайте 3 паттерна, запишите их в таблицу, см. ниже.

  1. Первый паттерн в точности является фрагментом последовательности Вашего белка (то есть только одной из последовательностей выравнивания)
  2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки Вашей выборки, и только их (другой вопрос, что паттерн будет находить в действительности:)
  3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими.
В этом упражнении надо показать умение использовать три основные элемента синтаксиса паттернов:
[ALK] — в данной позиции разрешены только остатки в квадратных скобках;
Х(3) — интервал в 3 любых остатка;
{WY} — запрет на остатки в фигурных скобках,
подробнее о правилах написания патернов см. Pattern syntax rules
Как "усилить" или "ослабить" паттерн см. в подсказке.

Проведите поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов, см. подсказку.

По результатам упражнения заполните табличку следующего вида:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности      
Сильный      
Слабый      

Упражнение 2. Найти и описать все мотивы в Вашем белке (по данным БД PROSITE)

Найдите в последовательности вашего белка все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
Например,
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 12
             
             


Формат отчета

Формат — HTML-страничка, названная "Паттерны и профили".

  1. Заголовок "Создание паттернов аминокислотных последовательностей"
    • Ссылка на HTML-файл с выбранным фрагментом выравнивания, по которому строились паттерны (названия последовательностей должны представлять собой ID белков!)
    • Таблица к упр. 1 (таблица должна иметь заголовок)
    • Краткий комментарий к таблице, в котором объясняется, что и зачем делалось, а также описаны возможные наблюдения. Например, указано, нашлись ли последовательности с названием, явно отличающимся от названия Вашего белка; если да, то с каким? Любые другие интересные наблюдения будут оценены по достоинству.
  2. Заголовок "Все описанные в PROSITE мотивы в заданном белке XXXX_Ecoli"
    • Таблица к упр. 2