Главная | Проекты | Семестры |
- Создание паттернов аминокислотных последовательностей.
Выбранный для составления паттернов участок выравнивания:
На основе этого выровненного участка я составила 3 паттерна (Pattern syntax rules).
Первый паттерн - по последовательности моего белка - жестко совпадает с рассматриваемым участком моего белка. Результаты поиска показали, что существует еще 12 белков с точно такими же участками.
Второй паттерн составлялся так, чтобы он соответствовал всем белкам из выравнивания, но минимальному количеству иных белков - для этого допускались только те аминокислоты, которые точно присутствуют в моих белках. Но, так как мои белки не полностью идентичны, возможные вариации одной и той же позиции дают большее число вариантов, поэтому такой паттерн соответствует еще 24 белкам.
Третий паттерн - слабый. Он допускает больше вариаций, чем второй, сильный, поэтому поиск по нему дает вдвое больше результатов. Для ослабления, например, вместо разрешения встретившихся аминокислот, являющихся положительно заряженными, был введен запрет на отрицательно заряженные; соответственно в позиции, где встречались короткие остатки, был введен запрет на длинные, и т. д.
Мне не хотелось сильно ослаблять паттерн, но поиск по слабому паттерну дает белки, идентификаторы которых начинаются уже не на GLUQ_* ( Glutamyl-Q tRNA(Asp) synthetase), а на SYE_* (Glutamyl-tRNA synthetase). Таблица 1. Результаты поиска составленных паттернов по SwissProt.
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены? Фрагмент последовательности H-R(2)-D-G-L-F-A-Y-N-L-A-V(3)-D(2)-H 13 Нет Сильный [KRHL]-R-X(0,2)-[RAQ]-[DE]-[GRP]-[LGV]-[FWI]-[ASG]-Y-[NHQ]-L-A-[TV]-V-[VL]-D(2)-[AIHE] 33 Да Слабый {DEGA}-R-X(0,2)-X-[DE]-X-{DEHKR}-{GADEKR}-{FIWPKR}-Y-[NHQ]-L-A-[TV]-V-[VL]-D(2) 78 Да
- Все описанные в PROSITE мотивы в заданном белке GLUQ_ECOLI.
Таблица 2. Мотивы моего белка, описанные в PROSITE.
Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке? PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 5 PS00005 PKC_PHOSPHO_SITE Сайт протеин-киназы C-фосфорилирования паттерн [ST]-x-[RK] неспецифична 2 PS00001 ASN_GLYCOSYLATION Сайт N-гликолизирования неспецифична N-{P}-[ST]-{P} неспецифична 2