Паттерны и профили


Создание паттернов аминокислотных последовательностей

Для создания паттерна был выбран следующий фрагмент выравнивания:

Выбранный фрагмент обведён красной рамкой.

На основании фрагмента были созданны три паттерна: один - просто участок последовательности белка YECD_ECOLI, позиции второго ("сильного") включают все остатки, встретившиеся в данном участке выравнивания, а третий ("слабый") похож на второй, но по возможности ослаблен.

Характеристика паттерна Паттерн Число записей банка Swiss-Prot с участками, удовлетворяющий паттерну Все ли последовательности из выравнивания найдены?
Фрагмент последовательности S-D-I-E-I-I-K-R-Q-W-G-A-F-Y-G-T-D-L-E 2 нет
Сильный [GESN]-[DET]-[WVIY]-[LQIRVEAT]-[LIV]-[TPHI]-K-[WTPR]-[RVQ]-
[YNW]-[SG]-[AGS]-F-[FKIY]-[NGK]-[ST]-[DPQN]-[LM]-[LED]
13 да
Слабый [LIV]-X-K-X-[RVQ]-[YNW]-[SG]-[AGS]-F-X-[NGK]-[ST] 14 да

Для того, чтобы увеличить число находок по "слабому" паттерну только лишь на одну, пришлось сильно его изменить по сравнению с "сильным" паттерном. Находками по "сильному" паттерну являются белки, выбранные для множественного выравнивания и аналогичные белки из других штамов тех же бактерий (например, YECD_ECOLI и YECD_ECO57). Все это подтверждает малое количество записей Swiss-Prot, найденных с помощью blastp во время составления списка вероятных гомологов белка YECD_ECOLI для построения множественного выравнивания.

Все описанные в PROSITE мотивы в заданном белке YECD_ECOLI

AC документа PROSITE Название мотива Краткое описание мотива Тип подписи Паттерн (регулярное выражение) Специфичность подписи Число находок
PS00867 CPSASE_2 Субдомен карбомоил-фосфат синтетазы
(Carbamoyl-phosphate synthase subdomain signature 2)
паттерн [LIVMF]-[LIMN]-E-[LIVMCA]-
N-[PATLIVM]-[KR]-[LIVMSTAC]
специфична 1
PS00008 MYRISTYL Сайт N-миристоилирования
(N-myristoylation site)
паттерн G-{EDRKHPFYW}-
X(2)-[STAGCN]-{P}
неспецифична 5
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеин киназой II
(Casein kinase II phosphorylation site)
паттерн [ST]-x(2)-[DE] неспецифична 5
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеин киназой С
(Protein kinase C phosphorylation site)
паттерн [ST]-x-[RK] неспецифична 1
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования
(N-glycosylation site)
паттерн N-{P}-[ST]-{P} неспецифична 1

Назад

2009 ©