Паттерны и профили
  1. Создание паттернов аминокислотных последовательностей

Выбранный участок выравнивания DhbE и его гомологов

Выбранный фрагмент выравнивания

Паттерн своими руками

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности SKLIPRTHDDYIYSLKRSVE 1 DHBE_BACSU
Сильный [SP]-K-[LG]-[IV]-[PM]-[LR]-[TA]- H-[DNK]-[DG]-[YL]-[AYVI]-[YS]- [SV]-[LVM]-[KRAT]-[RAQ]-[STQ]-[AV]-[DE] 6 Все
Средний [SP]-K-[LG]-[IVLA]-[PM]-[LR]-[TA]-H-X-{VFALIM}-[YL]-X-[YST]-[SV]-[LVM]-{DEF}-X(2)-[AV] 18 (20) Все
Слабый K-[LG]-[IVLA]-X-{P}-X-H-{W}-X(3)-[STY]-X-[LVM] 345 Все

Комментарий:

Я использовала фрагмент последовательности длиной 20 остатков, чтобы такой паттерн с большой вероятностью нашелся только в DhbE. В сильный паттерн я включила только все вариации из данного выравнивания, кроме выбранных мной для выравнивания белков нашелся ещё только один: EntE из E.&nsbp;coli O157:H7(в выравнивании использовался белок EntE из E.&nsbp;coli K12).

Средний паттрен умеет находить 20 гомологов.

Слабый паттерн находит много возможных гомологов, но также белки вроде ДНК- и актин-связывающих, участвующих в вакуолярном транспорте, рецепторов, ДНК-полимеразы III, EF-Tu из хлоропластов, ГАФД-дегидрогеназу, субъединицы вакуолярной АТФ-азы и митохондриальные транслокаторы Т_Т

Создать нечно среднее между средним и салбым паттернам у меня не получилось. Как не ужесточаю условия, все равно что-нибудь вроде полимеразы остается, и довольно большой процент. Возможно, стоит выбрать другую последовательность для паттерна.

Программа fuzzpro и сервер ExPASy дают разное количество белков.




  1. Все описанные в PROSITE мотивы в заданном белке DHBE_BACSU

Мотивы в DhbE

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00455 AMP_BINDING Putative AMP-binding domain signature паттерн [LIVMFY]-{E}-{VES}-[STG]- [STAG]-G-[ST]-[STEI]- [SG]-x-[PASLIVM]-[KR] специфична 1
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site паттерн [ST]-x-[RK] неспецифична 10
PS00008 MYRISTYL N-myristoylation site паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 5
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site паттерн [ST]-x(2)-[DE] неспецифична 11
PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site паттерн [RK]-x(2)-[DE]-x(3)- Yor[RK]-x(3)-[DE]-x(2)-Y неспецифична 2
PS00001 ASN_GLYCOSYLATION N-glycosylation site паттерн N-{P}-[ST]-{P} неспецифична 1

© Eugenia Zotova