Мотивы, паттерны и профили

Главная

Назад

PROSITE

Создание паттернов аминокислотных последовательностей

Импортируем в Genedoc множественное выравнивание, полученное на прошлом занятии с помощью muscle.
Выберем фрагмент выравнивания длиной 13 а.о. с 38% консервативных и полуконсервативных а.о. для дальнейшего исследования.

Рассмотрим выбранный фрагмент выравнивания. Создадим 3 паттерна, запишем их в таблицу, см. ниже.

  1. Первый паттерн в точности является фрагментом последовательности белка PSTS_ECOLI (то есть только одной из последовательностей выравнивания)
  2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки выборки, и только их (другой вопрос, что паттерн будет находить в действительности:)
  3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими: сократим паттерн, убрав 2/3 позиции слева/справа; заменим [LA] на {RH}, [VAL] на {KRW}; [NTKHP] на X.

Выбрали фрагмент множественного выравнивания, соответствующий 169-181 столбцам этого выравнивания.


Результаты поиска по паттернам в банке данных Swiss-Prot
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из выравнивания найдены?
Фрагмент последовательности AKLNPGLKLPSQN 2 найдена последовательность белка PSTS_ECOLI
Сильный [AKIV]-[AKS]-[LA]-N-[PQ]-[GST]-[VAL]-[NTKHP]-L-P-[GSDN]-[QTK]-[ANK] 8 все
Слабый {RH}-N-[PQ]-[GST]-{KRW}-X-L-P 470 все

Результаты поиска показали, что сильному паттерну удовлетворяют лишь белки семейста pstS, но из разных организмов;
поиск по слабому паттерну оказался более разнообразен: найдены белки из организмов человека, мыши, бактерии и многих других, что было вполне ожидаемо, так как вероятность наличия 3 консервативных остатков в разных организмах достаточно высока.

Все описанные в PROSITE мотивы в заданном белке PSTS_ECOLI (по данным БД PROSITE)
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования протеинкиназой С паттерн [ST] - x - [RK]
S or T is the phosphorylation site
неспецифична 2
PS00006 CK2_PHOSPHO_SITE сайт фосфорилирования казеинкиназой 2 паттерн [ST] - x(2) - [DE]
[S or T is the phosphorylation site]
неспецифична 4
PS00007 TYR_PHOSPHO_SITE сайт фосфорилирования тирозинкиназой паттерн <[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y
Y is the phosphorylation site
неспецифична 2
PS00008 MYRISTYL сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 11

Профилей у данного белка нет.
Из 4 типов мотивов 3 (сайты фосфолирования) из них, видимо, связаны с функцией белка: транспорт фосфат-ионов.

Небольшой комментарий к предыдущему заданию: выбранный фрагмент не является частью мотива.




© Ксения Лежнина 2008