Паттерны и банк PROSITE

Содержит ли Swissprot послание инопланетян?

Слово angry фактически встречается у 64 находок среди последовательностей белков банка Swissprot, тогда как теоретически этих находок должно быть около 73. Теоретическая встречаемость рассчитывалась с помощью использования данных о встречаемости конкретных аминокислот и объема банка Swissprot. Таким образом, мы можем утверждать, что слово angry не несет никакой функциональной нагрузки, не имеет смысла на языке белков.

Поиск гомологов с помощью сильных и слабых паттернов

В данной части практикума создавался "сильный" (т.е. паттерн с более сильными и жесткими условиями поиска) и "слабый" (содержащий более мягкие условия поиска) паттерны для поиска гомологов белка. Результаты представлены в таблице 1.

Табл. 1. Паттерны и результат их действия
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
Очень сильный {P-S-x(1)-I-R-V-E-A-D-E-L-T-Y-x(1,2)-H 1 Найден только исконный белок
Сильный D-x(1,2)-G-[VC]-L-Q-x(0,3)-D-x(1)-HW-x(1,2)-G-x(1,3)-[YSG]-x(1)-[PA]-x(1)-Y-x(1,2)-G 615 все
Слабый H-E-x(1,2)-H-x(1,2)-Y-E-Q 1415 все


Слабый паттерн были выбран нарочно "с запасом" - в него был включен мотив, обязательный для семейства белков M32, к которому принадлежит и белок YPWA_BACSU. Так как количество находок было очень большим, то вручную сложно проверять все ли последовательности выравнивания были найдены, поэтому я предполагаю, что все именно в силу слабости паттерна и обязательности его присутствия. Если же найдется такой гомолог, который не был найден с помощью этого паттерна, могу предполагать только то, что это зависит от использования в PROSITE только БД Swiss-Prot. Ведь при поиске гомологов с помощью Blast использовался RefSeq.

Табл. 2. Мотивы в последовательности YOWA_BACSU
Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00004 CAMP_PHOSPHO_SITE сайт цAMФ- и цГMФ-зависимых белков-киназ фосфорилирования паттерн [RK](2)-x-[ST] неспецифична 1
PS00008 MYRISTYL сайт N-миристилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 6
PS00001 ASN_GLYCOSYLATION сайт N-гликозилирования паттерн N-{P}-[ST]-{P} неспецифична 3
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования протеинкиназы С паттерн [ST]-x-[RK] неспецифична 6
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозинкиназы паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y неспецифична 4
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы II паттерн [ST]-x(2)-[DE] неспецифична 8
PS00016 RGD последовательность прикрепления клеток паттерн RGD неспецифична 1
PS00009 AMIDATION сайт амидирования паттерн x-G-[RK]-[RK] неспецифична 1

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru