Паттерны и профили


1.Создание паттернов по множественному выравниванию и поиск по паттернам в банке данных Swiss-Prot


Выбрала фрагмент длиной 16 а.о. для дальнейшего исследования так, чтобы от трети до половины колонок фрагмента были консервативны на 70-100%
Я выбрала такой фрагмент:

Теперь расмотрим этот фрагмент и запишем три паттерна для него:
Характеристика паттерна Паттерн Число последовательностей банка Swiss-Prot с мотивом, удовлетворяющим паттерну? Число последовательностей из моего выравнивания
Фрагмент последовательности VRLGAKLIEKHFTIDK 1 Нашлась только последовательность моего белка sp|P39625|SPSE_BACSU (как и ожидалось, собственно)
Сильный [VP]-[AR]-[LN]-[GE]-A-[KD]-[LV]-[IL]-E-[KR]-[HL]-[FKI]-[TS]-[LIW]-[DR]-[KA] 4 Присутствуют все белки, которые были в выравнивании (тоже, как и ожидалось)
Слабый [GED]-[ALGIV]-[KD]-[LVIGA]-[ILVGA]-E-[KR]-[HL]-[FKI]-[TS] 9 Да, нашлись все белки из выравнивания, и даже больше

Первый паттерн - точный фрагмент последовательности моего белка. Так что неудивительно, что банк нашел только мой белок
Второй паттерн - сильный. Заменила аминокислотные остатки в последовательности на вариативные остатки, встречающиеся во всех белках из моего выравнивания. Результат, опять же, ожидаем - там оказались лишь белки из моего выравнивания
Третий паттерн - ослабленный второй. Удалила по 3 аминокислотных остатка с каждого конца, по возможности добавила в вариативность аминокислотные остатки с похожими свойствами. Результатов нашлось 9, но насчет родственности этих белков я сильно сомневаюсь...Мало того, что организмы уж совсем далекие (от человека и мыши до Bacillus Subtiles), так еще и функции у них довольно разные (есть деаминазы (аж 4 штуки), белок, участвующий в построении кэпа РНК и белки из моего выравнивания. Правда, очень разнородно?). Если усилить паттерн, то находятся только белки из выравнивания, а если больше ослабить - находок гораздо больше (например, на паттерн [ALGIV]-[KD]-[LVIGA]-[ILVGA]-E-[KR]-[HL]-[FKI]-[TS] выдается 40 результатов, но все они еще более разнородны, чем эти 9)


2. Поиск и описание мотивов в моем белке SPSE_BACSU по данным БД Prosite


Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн Специфичность подпписи Число мотивов в белке
PS50844 AFP_LIKE Antifreeze protein-like domain profile Профиль
GIFTTAPIQKGEAFSEDNIAVLRPGQkpQGLHPRFFELLTsGVRAVRDIPADTGIVWDDI LLK
Специфична 1
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования Паттерн N-{P}-[ST]-{P} Неспецифична 2
PS00008 MYRISTYL Сайт N-миристоилирования Паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] Неспецифична 5
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеин киназы II Паттерн [ST]-x(2)-[DE][SorTisthephosphorylationsite] Неспецифична 3
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеин киназы С Паттерн [ST]-x-[RK] Неспецифична 3