Мотивы в аминокислотной последовательности
Поиск мотивов в последовательности с помощью средств PROSITE .
В базе данных PROSITE собрана коллекция сайтов, мотивов и доменов.
Они описаны с помощью паттернов.
С помощью программы ScanProsite (Scan a protein for PROSITE matches)
были найдено 4 известных мотива в последовательности MetJ_ECOLI.
* - часто встречвшийся в белках мотив
Правила постороения паттерна:
[] - в квадратных скобках записаны полуконсервативные аминокислоты,
например, запись [DE] обозначает, что на данной позиции стоит либо глутаминовая, либо аспарагиновая кислота
{} - в фигурных скобках записывают те маинокислотные остатки, которые не
могут стоять на данной позиции. Например, {LI} означает, что на этом месте могут присутствовать
любые аминокислоты, кроме лейцина и изолейцина.
х - обозначает то, что на данном месте может находиться любая аминокислота
()- в круглых скобках записывают число повторов,т.е. запись х(3) означает, что
в этом паттерне 3 раза может встретиться любая аминокислота. Запись G(2) говорит о том,
что глицин повторяется дважды, а [CA](4) - аланин или цистеин встречаются 4 раза подряд
Возьмем, например паттерн PS00006, который встречается в аминокислотной последовательности
белка MetJ_ECOLI - [ST]-x(2)-[DE]. Соотвотствующий ему мотив в данном белке : 52 TNSE 55
, где числа 52 и 55 означают позиции аминокислотных остатков.
Пример аминокислотной последовательности, идеально удовлетворяющей условиям данного паттерна, но не такой, как в этой последовательности:
MKKSLVDWEY .