prosite
Определим, сколько раз аминокислотная последовательность "RESID" встречается в Swiss-Prot теоретически.
Зная частоты встречаемости аргинина (R), глутамата (E), серина (S), изолейцина (I) и аспартата (D) в Swiss-Prot (0.0553, 0.0675, 0.0656, 0.0596 и 0.0545, соответственно)
и число всех аминокислот в Swiss-Prot (191670831), получим:
0.0553 × 0.0675 × 0.0656 × 0.0596 × 0.0545 × 191670831 ≈ 152
Аминокислотная последовательность "RESID" встречается в Swiss-Prot теоретически 152 раза.
Проверим, сколько раз в действительности эта аминокислотная последовательность встречается в Swiss-Prot. С помощью prosite в Swiss-Prot было найдено 167 аминокислотных последовательностей.
Таким образом, теоретический расчёт оказался почти верным.
Поиск гомологов UVRB_BACSU с помощью prosite | |||
Характеристика паттерна | Паттерн | Количество найденных в Swiss-Prot гомологов | Количество гомологов из репрезентативной выборки |
Сильный | [FYH]-x(1)-[PLA]-x(1)-G-D-Q-[PIV]-x(1)-A- [IV]-x(2)-[MIL]-x(3)-[ILVFY]-x(6)-[TQV]- [TNV]-L-[KILV]-G-[IVA]-T-G-[ST]-G-K-[ST] |
273 | 9 |
Слабый | G-D-Q-x(2)-A-[IV]-x(2)-[MIL]-x(12)- L-x(1)-G-x(1)-T-G-[ST]-G-K-[ST] |
365 | 9 |
Поиск мотивов у UVRB_BACSU с помощью prosite | ||||||
prosite entry | Название | Описание | Паттерн | Количество | ||
Специфичные мотивы | ||||||
PS51192 | HELICASE_ATP_BIND_1 | Superfamilies 1 and 2 helicase ATP-binding type-1 domain | 1 | |||
PS51194 | HELICASE_CTER | Superfamilies 1 and 2 helicase C-terminal domain | 1 | |||
PS50151 | UVR | UVR domain | 1 | |||
Неспецифичные мотивы | ||||||
PS00008 | MYRISTYL | N-myristoylation site | G-[TQMIA]-x(2)-[GSTN]-[GDEKFY] | 6 | ||
PS00001 | ASN_GLYCOSYLATION | N-glycosylation site | N-[EKY]-[ST]-[KRL] | 3 | ||
PS00009 | AMIDATION | Amidation site | x(1)-G-K-K | 1 | ||
PS00005 | PKC_PHOSPHO_SITE | Protein kinase C phosphorylation site | [ST]-x(1)-[KR] | 9 | ||
PS00007 | TYR_PHOSPHO_SITE | Tyrosine kinase phosphorylation site | [KR]-x(3)-D-x(2,3)-Y | 2 | ||
PS00006 | CK2_PHOSPHO_SITE | Casein kinase II phosphorylation site | [ST]-x(2)-[DE] | 12 | ||
PS00004 | CAMP_PHOSPHO_SITE | cAMP- and cGMP-dependent protein kinase phosphorylation site | K-K-x(1)-S | 1 | ||
PS00017 | ATP_GTP_A | ATP/GTP-binding site motif A (P-loop) | G-x(4)-G-K-T | 1 | ||
PS00016 | RGD | Cell attachment sequence | R-G-D | 1 |