Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Содержит ли SwissProt слово: "marry"?
Предскажем это. Для этого вычислим количество слов, посчитав вероятность перемножением встречаемости каждой буквы из слова, а затем умножим это на количество букв. Т.е.: 0,0242*0,0825*0,0553*0,0553*0,0292*191670831=34,3, т.е. 34 раза. В банке данных оно встречается чаще - 62 раза. Это может быть связано с тем, что многие последовательности начинаются с метионина, с той же буквы, что и слово. Это подтверждается находками: в 20 из них последовательность "marry" встречается в самом начала, в числе первых пяти остатков. Кроме того, среди находок обнаружено значительное число последовательностей из разных штаммов одних и тех же организмов.
Поиск вероятных гомологов белка MRGA_BACSU в SwissProt с помощью паттернов
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько) |
Сильный | H-W-[DHYFN]-[IVL]-x-G-x-x-F-[MRKF]-x-[LVIA]-H-x-[KLT]-x-E-[EKAT]-x-Y-[DETN]-x-[ATLVY]-x-x-x-[IFVY]-D-[SEADL]-[VLIT]-A-E-[RL] | 5 | 0 |
Слабый | [VI]-D-E-[VLI]-A-E-R-[VIL]-[LR] | 10 | 0 |
Поиск по SwissProt не выдал последовательности из множественного выравнивания, т.к. большинство белков не были описаны в этом банке данных. Однако, проведя поиск по TrEMBL для сильного паттерна находятся 14 последовательностей, а для слабого находятся все последовательности из выравнивания.
Поиск мотивов PROSITE в последовательности белка MRGA_BACSU
Зайдем в ScanProsite и в левое поле введем идентификатор последовательности белка MRGA_BACSU - P37960. Обратим внимание на то, стоит ли галочка в поле "Exclude patterns with a high probability of occurrence". Если в нем стоит галочка, то будут выданы только "специфичные" мотивы - те, которые отвечают семействам белков (один-два, а часто - ни одного). Если не стоит, то будут выданы распространенные мотивы.
Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (если это паттерн) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS00818 | DPS_1 | Dps protein family signature 1 | Паттерн | H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE] | специфична | 1 |
PS00819 | DPS_2 | Dps protein family signature 2 | Паттерн | [LIVMFY]-[DH]-x-[LIVM]-[GA]-E-R-x(3)-[LIF]-[GDN]-x(2)-[PA] | специфична | 1 |
PS00001 | ASN_GLYCOSYLATION | N-glycosylation site | Паттерн | N-{P}-[ST]-{P} | неспецифична | 3 |
PS00006 | CK2_PHOSPHO_SITE | Casein kinase II phosphorylation site | Паттерн | [ST]-x(2)-[DE] | неспецифична | 6 |
PS00008 | MYRISTYL | N-myristoylation site | Паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | неспецифична | 3 |
PS00005 | PKC_PHOSPHO_SITE | Protein kinase C phosphorylation site | Паттерн | [ST]-x-[RK | неспецифична | 1 |