В базе данных PROSITE собрана коллекция сайтов, мотивов и доменов. Они описаны с помощью паттернов и профилей-PSSM.
С помощью программы ScanProsite (Scan a protein for PROSITE matches) были найдено 25 известных мотивов в последовательности GlpT
Идентифи-катор паттерна (accession number) | Идентификатор документации PROSITE и краткое описание или название паттерна в соответствии с этим документом | Паттерн (регулярное выражение ) | Число мотивов, обнаруженных в моем белке |
PS00003 * | PDOC00003: Сайт сульфатирования тирозина | Отсутствует в источнике | 3 |
PS00005 * | PDOC00005: сайт фосфорелирования протеинкиназой С | [ST]-x-[RK] | 5 |
PS00006 * | PDOC00008: Сайт фосфорелирования казеинкиназой II | [ST]-x(2)-[DE]. | 3 |
PS00008 * | PDOC00008: Сайт N-миристоилирования | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}. | 11 |
PS00016 * | PDOC00016: Сайт прикрепления к клетке | R-G-D | 1 |
PS00942 | PDOC00726: Подпись семйства переносчиков glpT | [QEK]-[RF]-G-x(3)-[GSA]-[LIVF]-[WL]-[NS]-x-[SA]-[HM]-N-[LIV]-[GA]-G | 1 |
PS50850 ** | PDOC50850: Профиль семейства основных облегчителей диффузии | Отсутствует в источнике | 1 |
* - часто встречающиеся в белках мотивы
** - паттерн мотива, для которого в PROSITE есть еще и профиль
Для паттерна G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}:
Мотив моей последовательности = (33 – 38) GIFFGY
Пример: GMIIAL