Паттерны и банк PROSITE


Встречаемость слова "delta" в банке SwissProt.

Встречаемость букв в базе Swissprot для "delta" такова:

  • Asp (D) 5.45%
  • Glu (E) 6.75%
  • Leu (L) 9.66%
  • Thr (T) 5.34%
  • Ala (A) 8.25%
  • База содержит 191670831 аминокислот.

    Значит, теоретически слово "delta" должно встретиться 191670831*5,45*6,75*9,66*5,34*8,25*10^(-10)~300 раз.
    С помощью поиска по Prosite было найдено точное число встречаемости слова "delta". Оно оказалось равным 445.

    Поиск вероятных гомологов белка HUTI_BACSU в банке SwissProt с помощью паттернов

    Характеристика паттернаПаттернВ скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну?Сколько последовательностей из вашего выравнивания найдено?
    СильныйH-N-A-[VI]-[EV]-Y-F-[VI]-S-Y-Y-D-x(2)-Q-P-E-x-Y-[VI]-[PA]-x-[TSG]-D-[TL]-[YF]-I-[EAD]-[KT]-x(3)-[INV]-[NA]-D11Все
    Слабый[VI]-[EV]-Y-F-[VI]-S-Y-Y-D-x(2)-Q-P335Все

    Мотивы PROSITE в последовательности белка UVRB_BACSU

    Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи Паттерн Специфична ли подпись? Сколько мотивов нашлось в белке?
    PS00008 MYRISTYL N-myristoylation site Паттерн G-[TQMIA]-x(2)-[GSTN]-[GDEKFY] Нет 6
    PS00001 ASN_GLYCOSYLATION N-glycosylation site Паттерн N-[EKY]-[ST]-[KRL] Нет 3
    PS00009 AMIDATION Amidation site Паттерн x(1)-G-K-K Нет 1
    PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site Паттерн [ST]-x(1)-[KR] Нет 9
    PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site Паттерн [KR]-x(3)-D-x(2,3)-Y Нет 2
    PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site Паттерн [ST]-x(2)-[DE] Нет 12
    PS00004 CAMP_PHOSPHO_SITE cAMP- and cGMP-dependent protein kinase phosphorylation site Паттерн K-K-x(1)-S Нет 1
    PS00017 ATP_GTP_A ATP/GTP-binding site motif A (P-loop) Паттерн G-x(4)-G-K-T Нет 1