WELCOME MY FRIEND!


Паттерны и профили.

Создание паттернов аминокислотных последовательностей.

Импортировала в Genedoc множественное выравнивание, полученное на прошлом занятии с помощью muscle.

Мой белок - menc_ecoli - на пятой позиции выравнивания.
Выбрала фрагмент выравнивания длиной 20 а.о. для дальнейшего исследования. При этом вообще желательно, чтобы от трети до половины колонок фрагмента были консервативны на 70–100%.
Картинка с изображением выбранного фрагмента выравнивания (126 - 146 позиции):

sw:menc_salns
sw:menc_salsv
sw:menc_salar
sw:menc_citk8
sw:menc_ecoli
sw:menc_erwct
sw:menc_klep7 
sw:menc_pholl  
sw:menc_vibfm

Рассмотрела выбранный мною фрагмент множественного выравнивания. Создала 3 паттерна:

  1. Первый паттерн в точности является фрагментом последовательности моего белка (то есть только одной из последовательностей выравнивания)
    M-P-G-E-K-V-A-K-V-K-V-G-L-Y-E-A-V-R-D-G-M
  2. Второй ("сильный") паттерн должен быть такой, чтобы он распознавал все белки моей выборки, и только их
    M-[SP]-G-[KQE]-K-[VI]-A-K-[VI]-K-[VI]-G-L-[WY]-E-[PA]-[VI]-R-D-G-M
  3. Третий ("слабый") паттерн - на основе второго, требования к последовательности более мягкие.
    G-[KQE]-K-[VI]-A-K-[VI]-K-[VI]-G-L-[WY]-E-[PA]-[VI]
Три основные элемента синтаксиса паттернов:
[ALK] — в данной позиции разрешены только остатки в квадратных скобках;
Х(3) — интервал в 3 любых остатка;
{WY} — запрет на остатки в фигурных скобках,
подробнее о правилах написания патернов см. Pattern syntax rules

Провела поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов.

По результатам:

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности M-P-G-E-K-V-A-K-V-K-V-G-L-Y-E-A-V-R-D-G-M 24, 2 моих нет
Сильный M-[SP]-G-[KQE]-K-[VI]-A-K-[VI]-K-[VI]-G-L-[WY]-E-[PA]-[VI]-R-D-G-M 45, 9 моих (все) да
Слабый G-[KQE]-K-[VI]-A-K-[VI]-K-[VI]-G-L-[WY]-E-[PA]-[VI] 57, 9 моих да

В сильный паттерн включила все позиции выбранного фрагмента выравнивания, а в каждой позиции разрешила все буквы, встретившиеся в какой-либо из последовательностей.
При создании слабого паттерна сократила паттерн, убрав 2 позиции с начального конца и 4 с конечного.
Как видно, не смотря на различия в силе двух последних паттернов, поиск во всех случаях дал высокие и почти равные результаты. Это указывает на то, что был выбран участок выравнивания с очень большим содержанием консервативных позиций.

Все описанные в PROSITE мотивы в белке MENC_Ecoli

Нашла в последовательности моего белка все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся):

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site - сайт фосфорилирования тирозиновой киназы паттерн [RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y неспецифична 1
PS00008 MYRISTYL N-myristoylation site - сайт N-миристоилирования паттерн G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} неспецифична 6
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site - сайт фосфорилирования казеиновой киназы II паттерн [ST] - x(2) - [DE] неспецифична 4
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site - сайт фосфорилирования белковой киназы С паттерн [ST] - x - [RK] неспецифична 1




К блоку
Ко 2му семестру
На главную



© Шишкова Настя, 2008