Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Мотивы, паттерны и профили.


  1. Создание паттернов аминокислотных последовательностей.
    Выбранный для составления паттернов участок выравнивания:



    На основе этого выровненного участка я составила 3 паттерна (Pattern syntax rules).

    Первый паттерн - по последовательности моего белка - жестко совпадает с рассматриваемым участком моего белка. Результаты поиска показали, что существует еще 12 белков с точно такими же участками.

    Второй паттерн составлялся так, чтобы он соответствовал всем белкам из выравнивания, но минимальному количеству иных белков - для этого допускались только те аминокислоты, которые точно присутствуют в моих белках. Но, так как мои белки не полностью идентичны, возможные вариации одной и той же позиции дают большее число вариантов, поэтому такой паттерн соответствует еще 24 белкам.

    Третий паттерн - слабый. Он допускает больше вариаций, чем второй, сильный, поэтому поиск по нему дает вдвое больше результатов. Для ослабления, например, вместо разрешения встретившихся аминокислот, являющихся положительно заряженными, был введен запрет на отрицательно заряженные; соответственно в позиции, где встречались короткие остатки, был введен запрет на длинные, и т. д.
    Мне не хотелось сильно ослаблять паттерн, но поиск по слабому паттерну дает белки, идентификаторы которых начинаются уже не на GLUQ_* ( Glutamyl-Q tRNA(Asp) synthetase), а на SYE_* (Glutamyl-tRNA synthetase). Таблица 1. Результаты поиска составленных паттернов по SwissProt.

    Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
    Фрагмент последовательности H-R(2)-D-G-L-F-A-Y-N-L-A-V(3)-D(2)-H 13 Нет
    Сильный [KRHL]-R-X(0,2)-[RAQ]-[DE]-[GRP]-[LGV]-[FWI]-[ASG]-Y-[NHQ]-L-A-[TV]-V-[VL]-D(2)-[AIHE] 33 Да
    Слабый {DEGA}-R-X(0,2)-X-[DE]-X-{DEHKR}-{GADEKR}-{FIWPKR}-Y-[NHQ]-L-A-[TV]-V-[VL]-D(2) 78 Да


  2. Все описанные в PROSITE мотивы в заданном белке GLUQ_ECOLI.

    Таблица 2. Мотивы моего белка, описанные в PROSITE.

    Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
    PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 5
    PS00005 PKC_PHOSPHO_SITE Сайт протеин-киназы C-фосфорилирования паттерн [ST]-x-[RK] неспецифична 2
    PS00001 ASN_GLYCOSYLATION Сайт N-гликолизирования неспецифична N-{P}-[ST]-{P} неспецифична 2


© Smirnova Victoriya, 2008