Паттерны и профили.

Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-Prot.

Импортируем в Genedoc множественное выравнивание, полученное на прошлом занятии с помощью muscle.
Выбрала фрагмент выравнивания длиной 20 а.о. для дальнейшего исследования.

Выбранный фрагмент выравнивания.

Полученное выравнивание в fasta-,msf- и gif-формате (с прошлого пратикума).

  1. Первый паттерн в точности является фрагментом последовательности белка ECOT_ECOLI.
  2. Второй ("сильный") паттерн построим так, чтобы он распознавал все белки выборки, и только их.
  3. Третий ("слабый") паттерн создаём на основе второго, сделав требования к последовательности более мягкими.

Таблица:Паттерны и их поиск в Swiss-Prote

Характеристика паттерна

Паттерн

В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну?

Все ли последовательности из Вашего выравнивания найдены?

Фрагмент последовательности

( 119123 )

MMACPDGKKEKKFVTAYLGDA

20

Нет.Не найдено ни одной кроме моего белка.

Сильный

[MR]-M-A-C-[FP]-[ESGD]-[LGIQN]-[ATK]-[KEAR]-[KTERQ]-[ESIQKP]-[ARKQ]-[FP]-[VI]-[QASPT]-x(0,1)-x(0,1)-x(0,1)-[PG]-[DNE]-[EGDA]

35

Да, все 7 гомологов.

Слабый

M-A-C-[FP]-{AP}-{MH}-[ATK]-[KEAR]-X-X-X-[FP]-[VI]-{VL}-x(0,1)-x(0,1)-x(0,1)

42

Да,найдены все 7 гомологов.

При поиске первого паттерна был найден только мой белок,а также близкородственные ему белки из серии ECOT_ECO** и ECOT_SHI**.

Как и следовало ожидать,при поиске второго,"сильного",паттерна было найдено 35 белков,в том числе и все 7 гомологов.

Как это ни странно...Но при поиске "слабого" паттерна было найдено всего-навсего 42 белка,причём последовательность "сильного" паттерна была очень сильно ослаблена.Ну и естественно все 7 гомологов были найдены.

Но больше всего меня удивило,что предыдущие две попытки давали тоже очень маленькие результаты:36 и 37 последовательностей.

Все описанные в PROSITE мотивы в заданном белке ECOT_ECOL

 

Идентификатор документа PROSITE (AC)

Название мотива

Краткое описание мотива

Тип подписи (паттерн, профиль)

Паттерн (регулярное выражение)

Специфична ли подпись?

Сколько мотивов нашлось в белке?

PS00006

CK2_PHOSPHO_SITE

киназа казеина 2-ого сайта фосфорилирования

паттерн

[ST] - x(2) - [DE] [S or T is the phosphorylation site]

неспецифична

1

PS00005

PKC_PHOSPHO_SITE

белковая киназа сайта фосфорилирования

паттерн

[ST] - x - [RK] S or T is the phosphorylation site

неспецифична

1

PS00001

ASN_GLYCOSYLATION

N-гликозиновый сайт

паттерн

N - {P} - [ST] - {P} N is the glycosylation site

неспецифична

1

PS00007

TYR_PHOSPHO_SITE

тирозин-киназа сайта фосфорилирования

паттерн

[RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y Y is the phosphorylation site

неспецифична

1

PS00009

AMIDATION

амидный сайт

паттерн

x - G - [RK] - [RK] x is the amidation site

неспецифична

1

По итогам поиска было найдено 5 паттернов.

Ни одного специфичного паттерна не найдено.

 

  1.  

 


©Терешкова Алеся,2009