Создание паттернов аминокислотных последовательностей |
Рассмотрим выбранный фрагмент из множественного выравнивания, длины 11 а. о (594-605)

Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности |
QIDDLMARRDV |
3 |
Нет(2 из 3 это FTSH_ECO57 и FTSH_ECOLI) |
Сильный |
Q-I-[KD]-[NQD]-L-[LM]-[SNKAE]-[SGR]-[RE]-[QAPSDE]-[LV] |
14 |
Все |
Слабый |
Q-I-[KD]-{TS}-L-[LM]-[SNKAE]-[SGR]-[RE]-[QAPSDE]-{AI} |
21 |
Все |
Создано 3 паттерна.
1) Первый паттерн в точности является фрагментом последовательности белка FTSH_ECOLI
2) Второй ("сильный") паттерн распознат все белки выборки, и только их.
3) Третий ("слабый") паттерн создан на основе второго, сделав требования к последовательности более мягкими.
1) По первому, самому строгому, паттерну, a это участок FTSH_ECOLI с помощью PROSITE в базе данных SwissProt было найдено 3 последовательности, 2 из которых это белки ECO57 и ECOLI это очень близкие гомологи отличающиеся одним а о.
2) По ворому запросу, были найдены все белки, представленные в множественном выравнивании, и еще были найди 3 белка из того семейства и являющиеся гомологами белка FTSH_ECOLI
3) По третьему запросу, самому мягкому, были найдены 21 запись, включающие все 11 белков множественного выравнивания. Были найдены 14 результатов "строгого " выравнивание, причем все принадлежащие семейству FTSH, а оставшиеся все 7 принадлежать семейству URK, и у всех 7 белков этого семейства URK одинаковая последовательность (QIKELLAGRPV).
Идентификатор документа PROSITE (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (регулярное выражение) |
Специфичность |
Количество мотивов в белке |
PS00674 |
AAA |
AAA-protein family signature |
паттерн |
[LIVMTR] - x - [LIVMT] - [LIVMF] - x - [GATMC] - [ST] - [NS] - x(4) - [LIVM] - D - x - [AS] - [LIFAV] - x(1,2) - R |
специфичен |
1 |
PS00009 |
AMIDATION |
Amidation site |
паттерн |
x - G - [RK] - [RK]
x is the amidation site |
неспецифичен |
1 |
PS00001 |
ASN_GLYCOSYLATION |
N-glycosylation site |
паттерн |
N - {P} - [ST] - {P}
N is the glycosylation site |
неспецифичен |
2 |
PS00005 |
PKC_PHOSPHO_SITE |
Protein kinase C phosphorylation site |
паттерн |
[ST] - x - [RK]
S or T is the phosphorylation site |
неспецифичен |
7 |
PS00006 |
CK2_PHOSPHO_SITE |
Casein kinase II phosphorylation site |
паттерн |
[ST] - x(2) - [DE] [S or T is the phosphorylation site] |
неспецифичен |
6 |
PS00004 |
CAMP_PHOSPHO_SITE |
cAMP- and cGMP-dependent protein kinase phosphorylation site |
паттерн |
[RK](2) - x - [ST]
S or T is the phosphorylation site |
неспецифичен |
1 |
PS00008 |
MYRISTYL |
N-myristoylation site |
паттерн |
G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} [G is the N - myristoylation site] |
неспецифичен |
11 |
PS00017 |
ATP_GTP_A |
ATP/GTP-binding site motif A (P-loop) |
паттерн |
[AG] - x(4) - G - K - [ST] |
неспецифичен |
2 |
PS00007 |
TYR_PHOSPHO_SITE |
Tyrosine kinase phosphorylation site |
паттерн |
[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y
Y is the phosphorylation site |
неспецифичен |
2 |