В базе данных PROSITE собрана коллекция сайтов, мотивов и доменов. Они описаны с помощью паттернов и профилей-PSSM. С помощью программы ScanProsite (Scan a protein for PROSITE matches) были найдены 16 известных мотивов в последовательности GlpF.
Идентификатор патерна (accesion number) |
Идентификатор документации PROSITE и краткое описание или название патерна в соответствии с этим документом |
Патерн (регулярное выражение) | Число мотивов, обнаруженных в белке |
PS00005 | PDOC00005 (сайт С-фосфорилирования киназы) | [ST]-x-[RK]* | 1 |
PS00006 | PDOC00006 (сайт II фосфорилирования казеиновой киназы) |
[ST]-x(2)-[DE]* | 1 |
PS00008 | PDOC00008 (сайт ацилирования N-конца миристатом) |
G-{EDRKHPFYW}-x(2)-[STAGCN]-{p}* | 13 |
PS00221 | PDOC00193 (патерн, распознающий семейство MIP (трансмембрвнных транспортных белков)) |
[HNQA]-x-N-P-[STA]-[LIVMF]-[ST]-[LIVMF]-[GSTAFY] | 1 |
* - часто встречающийся в белке мотив
Для одного из мотивов:
[HNQA]-x-N-P-[STA]-[LIVMF]-[ST]-[LIVMF]-[GSTAFY].
Возможна следующая аминокислотная последовательность:
H-G-N-P-S-L-S-L-G