Поиск мотивов в последовательности LacY_ECOLI с помощью средств PROSITE

В базе данных PROSITE собрана коллекция сайтов, мотивов и доменов. Они описаны с помощью паттернов и профилей (что бывает реже).
С помощью программы ScanProsite (Scan a protein for PROSITE matches) были найдены 8 известных мотивов в последовательности LacY_ECOLI.

Идентификатор
паттерна
(accession number)
Идентификатор документации PROSITE
и краткое описание или название паттерна
в соответствии с этим документом
Паттерн (регулярное выражение) Число мотивов,
обнаруженных
в моем белке
PS00001* PDOC00001
ASN_GLYCOSYLATION
(сайт N-гликолизации)
N-{P}-[ST]-{P} 2
PS00005* PDOC00005
PKC_PHOSPHO_SITE
(Сайт фосфорилирования протеин киназы С)
[ST]-x-[RK] 4
PS00006* PDOC00006 CK2_PHOSPHO_SITE
(Сайт фосфорилирования казеин киназы II)
[ST]-x(2)-[DE] 5
PS00008* PDOC00008
MYRISTYL
(сайт N-миристоиляции)
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} 10
PS00896 PDOC00698
LACY_1
(семейство LacY протон/сахарных симпортеров, сигнатура 1)
G-[LIVM](2)-x-D-[RK]-L-G-L-[RK](2)-x-[LIVM](2)-W 1
PS00897 PDOC00698
LACY_2
(семейство LacY протон/сахарных симпортеров, сигнатура 2)
P-x-[LIVMF](2)-N-R-[LIVM]-G-x-K-N-[STA]-[LIVM](3) 1
PS50314** PDOC50099
PHE_RICH
(богатый фенилаланином участок)
1
PS50850** PDOC50850
MFS
Суперсемейство главных переносчиков
1
* - отмечены часто встречающиеся в белках мотивы,
** - отмечен паттерн мотива, для которого в PROSITE есть еще и профиль.

Был выбран паттерн из 10-12 позиций G-[LIVM](2)-x-D-[RK]-L-G-L-[RK](2)-x-[LIVM](2)-W. Он соответствует мотиву последовательности LacY_ECOLI : GLLSDKLGLRKYLLW, но можно придумать другую последовательность, удовлетворяющая данному паттерну: GIIADRLGLRRTLLW. Следовательно, можно сделать вывод, что паттерн неоднозначно описывает мотив последовательности, что при решении некоторых задач неудобно.

Назад