Создание паттернов аминокислотных последовательностей

 

Рассмотрим выбранный фрагмент из множественного выравнивания, длины 11 а. о (594-605)

Характеристика паттерна
Паттерн
В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну?
Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности
QIDDLMARRDV
3
Нет(2 из 3 это FTSH_ECO57 и FTSH_ECOLI)
Сильный
Q-I-[KD]-[NQD]-L-[LM]-[SNKAE]-[SGR]-[RE]-[QAPSDE]-[LV]
14
Все
Слабый
Q-I-[KD]-{TS}-L-[LM]-[SNKAE]-[SGR]-[RE]-[QAPSDE]-{AI}
21
Все

Создано 3 паттерна.
1) Первый паттерн в точности является фрагментом последовательности белка FTSH_ECOLI
2) Второй ("сильный") паттерн распознат все белки выборки, и только их. 
3) Третий ("слабый") паттерн создан на основе второго, сделав требования к последовательности более мягкими
.

1) По первому, самому строгому, паттерну, a это участок FTSH_ECOLI с помощью PROSITE в базе данных SwissProt было найдено 3 последовательности, 2 из которых это белки ECO57 и ECOLI это очень близкие гомологи отличающиеся одним а о.

2) По ворому запросу, были найдены все белки, представленные в множественном выравнивании, и еще были найди 3 белка из того семейства и являющиеся гомологами белка FTSH_ECOLI

3) По третьему запросу, самому мягкому, были найдены 21 запись, включающие все 11 белков множественного выравнивания. Были найдены 14 результатов "строгого " выравнивание, причем все принадлежащие семейству FTSH, а оставшиеся все 7 принадлежать семейству URK, и у всех 7 белков этого семейства URK одинаковая последовательность (QIKELLAGRPV).

Идентификатор документа PROSITE (AC)
Название мотива
Краткое описание мотива
Тип подписи (паттерн, профиль)
Паттерн (регулярное выражение)
Специфичность
Количество мотивов в белке
PS00674
AAA
AAA-protein family signature
паттерн
[LIVMTR] - x - [LIVMT] - [LIVMF] - x - [GATMC] - [ST] - [NS] - x(4) - [LIVM] - D - x - [AS] - [LIFAV] - x(1,2) - R
специфичен
1
PS00009
AMIDATION
Amidation site
паттерн
x - G - [RK] - [RK] 
x is the amidation site
неспецифичен
1
PS00001
ASN_GLYCOSYLATION
N-glycosylation site
паттерн
N - {P} - [ST] - {P} 
N is the glycosylation site
неспецифичен
2
PS00005
PKC_PHOSPHO_SITE
Protein kinase C phosphorylation site
паттерн
[ST] - x - [RK] 
S or T is the phosphorylation site
неспецифичен
7
PS00006
CK2_PHOSPHO_SITE
Casein kinase II phosphorylation site
паттерн
[ST] - x(2) - [DE] [S or T is the phosphorylation site]
неспецифичен
6
PS00004
CAMP_PHOSPHO_SITE
cAMP- and cGMP-dependent protein kinase phosphorylation site
паттерн
[RK](2) - x - [ST] 
S or T is the phosphorylation site
неспецифичен
1
PS00008
MYRISTYL
N-myristoylation site
паттерн
G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} [G is the N - myristoylation site]
неспецифичен
11
PS00017
ATP_GTP_A
ATP/GTP-binding site motif A (P-loop)
паттерн
[AG] - x(4) - G - K - [ST]
неспецифичен
2
PS00007
TYR_PHOSPHO_SITE
Tyrosine kinase phosphorylation site
паттерн
[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y 
Y is the phosphorylation site
неспецифичен
2

 

 

© Замараев Алексей