Мотивы, MEME & ProSite

На прошлом практикуме речь шла о мотивах. Одним из определений мотива является некая последовательность аминокислот, сходная у белков, выполняющих одну функцию. Он служит сигнальным элементов, позволяющих определять различные классы белков. Для задания я использовал последовательности из прошлого практикума ( fasta файл можно получить по ссылке ). Для поиска возможных мотивов был использован сервис ProSite ( ProSite).
Для трех последовательностей был найден мотив.

Рисунок 1. Множественное выравнивание.62 - 72 - мотив.

Результатом стал паттерн - графическая запись мотива - PPASE, PS00387; Inorganic pyrophosphatase signature (PATTERN).( Описание мотива). Паттерн имеет следующий вид:

D-[SGDN]-D-[PE]-[LIVMF]-D-[LIVMGAC]


3 остатка аспарагиновой кислоты служат для связи катиона металла. Это сильный паттерн. Он позволяет найти все белки из данного выравнивания. Из базы Uniprot/Swiss-prot по данному паттерну находится 124 белка из 137 белков, принадлежаших классу фосфатаз. 100

Рисунок 2. Лого паттерна.

Далее на основе сильного паттерна был создан слабый паттерн. Нельзя из него исключить D, так как они связывают металл. Тогда слабый паттерн будет выглядеть следующим образом:

D-X-D-X-X-D-X


Слабый паттерн даёт больше находок, но многие из них не входят в класс фосфатаз. В базе Uniprot/Swiss-prot было найдено 13303 совпадений в 10001 последовательности. Как видно мотив очень слабый.


Просвиров Кирилл. 2013.