Мотивы, паттерны и профили
Главная
Назад
PROSITE
Создание паттернов аминокислотных последовательностей
Импортируем в Genedoc множественное выравнивание,
полученное на прошлом занятии с помощью muscle.
Выберем фрагмент выравнивания длиной 13 а.о. с 38% консервативных и полуконсервативных а.о. для дальнейшего
исследования.
Рассмотрим выбранный фрагмент выравнивания.
Создадим 3 паттерна, запишем их в таблицу, см. ниже.
- Первый паттерн в точности является фрагментом последовательности
белка PSTS_ECOLI (то есть только одной из последовательностей выравнивания)
- Второй ("сильный") паттерн надо постараться построить так,
чтобы он распознавал все белки выборки, и только их
(другой вопрос, что паттерн будет находить в действительности:)
- Третий ("слабый") паттерн надо создать на основе второго,
сделав требования к последовательности более мягкими: сократим паттерн, убрав 2/3 позиции слева/справа; заменим [LA] на {RH},
[VAL] на {KRW}; [NTKHP] на X.
Выбрали фрагмент множественного выравнивания, соответствующий 169-181 столбцам этого выравнивания.

Результаты поиска по паттернам в банке данных Swiss-Prot
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из выравнивания найдены? |
Фрагмент последовательности |
AKLNPGLKLPSQN |
2 |
найдена последовательность белка PSTS_ECOLI |
Сильный |
[AKIV]-[AKS]-[LA]-N-[PQ]-[GST]-[VAL]-[NTKHP]-L-P-[GSDN]-[QTK]-[ANK] |
8 |
все |
Слабый |
{RH}-N-[PQ]-[GST]-{KRW}-X-L-P |
470 |
все |
Результаты поиска показали, что сильному паттерну удовлетворяют лишь белки семейста pstS, но из разных организмов;
поиск по слабому паттерну оказался более разнообразен: найдены белки из организмов человека, мыши, бактерии и многих других,
что было вполне ожидаемо, так как вероятность наличия 3 консервативных остатков в разных организмах достаточно высока.
Все описанные в PROSITE мотивы в заданном белке PSTS_ECOLI (по данным БД
PROSITE)
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
PS00005 |
PKC_PHOSPHO_SITE |
сайт фосфорилирования протеинкиназой С |
паттерн |
[ST] - x - [RK] S or T is the phosphorylation site |
неспецифична |
2 |
PS00006 |
CK2_PHOSPHO_SITE |
сайт фосфорилирования казеинкиназой 2 |
паттерн |
[ST] - x(2) - [DE] [S or T is the phosphorylation site] |
неспецифична |
4 |
PS00007 |
TYR_PHOSPHO_SITE |
сайт фосфорилирования тирозинкиназой |
паттерн |
<[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y
Y is the phosphorylation site |
неспецифична |
2 |
PS00008 |
MYRISTYL |
сайт N-миристоилирования |
паттерн |
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} |
неспецифична |
11 |
Профилей у данного белка нет.
Из 4 типов мотивов 3 (сайты фосфолирования) из них, видимо, связаны с функцией белка: транспорт фосфат-ионов.
Небольшой комментарий к предыдущему заданию: выбранный фрагмент не является частью мотива.
© Ксения Лежнина 2008
|