Паттерны

Главная Семестры Проекты Заметки О себе Полезные ссылки


Содержит ли SwissProt слово: "marry"?

Предскажем это. Для этого вычислим количество слов, посчитав вероятность перемножением встречаемости каждой буквы из слова, а затем умножим это на количество букв. Т.е.: 0,0242*0,0825*0,0553*0,0553*0,0292*191670831=34,3, т.е. 34 раза. В банке данных оно встречается чаще - 62 раза. Это может быть связано с тем, что многие последовательности начинаются с метионина, с той же буквы, что и слово. Это подтверждается находками: в 20 из них последовательность "marry" встречается в самом начала, в числе первых пяти остатков. Кроме того, среди находок обнаружено значительное число последовательностей из разных штаммов одних и тех же организмов.

Поиск вероятных гомологов белка MRGA_BACSU в SwissProt с помощью паттернов

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
Сильный H-W-[DHYFN]-[IVL]-x-G-x-x-F-[MRKF]-x-[LVIA]-H-x-[KLT]-x-E-[EKAT]-x-Y-[DETN]-x-[ATLVY]-x-x-x-[IFVY]-D-[SEADL]-[VLIT]-A-E-[RL] 5 0
Слабый [VI]-D-E-[VLI]-A-E-R-[VIL]-[LR] 10 0


Поиск по SwissProt не выдал последовательности из множественного выравнивания, т.к. большинство белков не были описаны в этом банке данных. Однако, проведя поиск по TrEMBL для сильного паттерна находятся 14 последовательностей, а для слабого находятся все последовательности из выравнивания.

Поиск мотивов PROSITE в последовательности белка MRGA_BACSU

Зайдем в ScanProsite и в левое поле введем идентификатор последовательности белка MRGA_BACSU - P37960. Обратим внимание на то, стоит ли галочка в поле "Exclude patterns with a high probability of occurrence". Если в нем стоит галочка, то будут выданы только "специфичные" мотивы - те, которые отвечают семействам белков (один-два, а часто - ни одного). Если не стоит, то будут выданы распространенные мотивы.

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00818 DPS_1 Dps protein family signature 1 Паттерн H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE] специфична 1
PS00819 DPS_2 Dps protein family signature 2 Паттерн [LIVMFY]-[DH]-x-[LIVM]-[GA]-E-R-x(3)-[LIF]-[GDN]-x(2)-[PA] специфична 1
PS00001 ASN_GLYCOSYLATION N-glycosylation site Паттерн N-{P}-[ST]-{P} неспецифична 3
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site Паттерн [ST]-x(2)-[DE] неспецифична 6
PS00008 MYRISTYL N-myristoylation site Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 3
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site Паттерн [ST]-x-[RK неспецифична 1