Характеристика паттерна | Паттерн | Число последовательностей банка Swiss-Prot с мотивом, удовлетворяющим паттерну? | Число последовательностей из моего выравнивания |
Фрагмент последовательности | VRLGAKLIEKHFTIDK | 1 | Нашлась только последовательность моего белка sp|P39625|SPSE_BACSU (как и ожидалось, собственно) |
Сильный | [VP]-[AR]-[LN]-[GE]-A-[KD]-[LV]-[IL]-E-[KR]-[HL]-[FKI]-[TS]-[LIW]-[DR]-[KA] | 4 | Присутствуют все белки, которые были в выравнивании (тоже, как и ожидалось) |
Слабый | [GED]-[ALGIV]-[KD]-[LVIGA]-[ILVGA]-E-[KR]-[HL]-[FKI]-[TS] | 9 | Да, нашлись все белки из выравнивания, и даже больше |
Первый паттерн - точный фрагмент последовательности моего белка. Так что неудивительно, что банк нашел только мой белок
Второй паттерн - сильный. Заменила аминокислотные остатки в последовательности на вариативные остатки, встречающиеся во всех белках из моего выравнивания. Результат, опять же, ожидаем - там оказались лишь белки из моего выравнивания
Третий паттерн - ослабленный второй. Удалила по 3 аминокислотных остатка с каждого конца, по возможности добавила в вариативность аминокислотные остатки с похожими свойствами. Результатов нашлось 9, но насчет родственности этих белков я сильно сомневаюсь...Мало того, что организмы уж совсем далекие (от человека и мыши до Bacillus Subtiles), так еще и функции у них довольно разные (есть деаминазы (аж 4 штуки), белок, участвующий в построении кэпа РНК и белки из моего выравнивания. Правда, очень разнородно?). Если усилить паттерн, то находятся только белки из выравнивания, а если больше ослабить - находок гораздо больше (например, на паттерн [ALGIV]-[KD]-[LVIGA]-[ILVGA]-E-[KR]-[HL]-[FKI]-[TS] выдается 40 результатов, но все они еще более разнородны, чем эти 9)
Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн | Специфичность подпписи | Число мотивов в белке |
PS50844 | AFP_LIKE | Antifreeze protein-like domain profile | Профиль | GIFTTAPIQKGEAFSEDNIAVLRPGQkpQGLHPRFFELLTsGVRAVRDIPADTGIVWDDI LLK |
Специфична | 1 |
PS00001 | ASN_GLYCOSYLATION | Сайт N-гликозилирования | Паттерн | N-{P}-[ST]-{P} | Неспецифична | 2 |
PS00008 | MYRISTYL | Сайт N-миристоилирования | Паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] | Неспецифична | 5 |
PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеин киназы II | Паттерн | [ST]-x(2)-[DE][SorTisthephosphorylationsite] | Неспецифична | 3 |
PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования протеин киназы С | Паттерн | [ST]-x-[RK] | Неспецифична | 3 |