В базе данных PROSITE собрана коллекция сайтов, мотивов и доменов, описанных с помощью паттернов и правил. С помощью программы ScanProsite (Scan a protein for PROSITE matches) были найдено 8 известных мотивов в последовательности DHSB_ECOLI.
Идентификатор паттерна | Идентификатор документации PROSITE и краткое описание или название паттерна в соответствии с этим документом | Паттерн (регулярное выражение) | Число мотивов, обнаруженных в моем белке |
---|---|---|---|
PS00003* | PDOC00003 SULFATION Сайт тирозин сульфатирования | Нет в источнике | 1 |
PS00005* | PDOC00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеинкиназой C | [ST]-x-[RK] | 2 |
PS00006* | PDOC00006 CK2_PHOSPHO_SITE Cайт фосфорилирования казеинкиназой II | [ST]-x(2)-[DE] | 3 |
PS00007* | PDOC00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозинкиназой | [RK]-x(2,3)-[DE]-x(2,3)-Y | 1 |
PS00008* | PDOC00008 MYRISTYL Сайт N-миристоилирования | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | 7 |
PS00009* | PDOC00009 AMIDATION Сайт амидирования | x-G-[RK]-[RK] | 1 |
PS00198 | PDOC00176 4FE4S_FERREDOXIN 4Fe-4S ферродоксиновый регион железо-серного связывания | C-x(2)-C-x(2)-C-x(3)-C-[PEG] | 1 |
PS50311** | PDOC50099 CYS_RICH Регион, богатый цистеином | Высокая концентрация цистеиновых АКО в профиле | 1 |
Звёздочкой (*) обозначаются часто встречающиеся паттерны (pattern with a high probability of occurrence). Двойной звёздочкой (**) обозначен мотив, для которого в PROSITE имеется профиль.
Был выбран паттерн PDOC00007. Требовалось создать последовательность, удовлетворяющую ему. Напоминание: это паттерн [RK]-x(2,3)-[DE]-x(2,3)-Y
. В результате ему подходит, например, последовательность RLPEWWRY
.