Паттерны и профили.
Создать паттерны по множественному выравниванию и провести поиск по
паттернам в банке данных Swiss-Prot.
Импортируем в Genedoc множественное выравнивание,
полученное на прошлом занятии с помощью muscle.
Выбрала фрагмент выравнивания длиной 20 а.о. для дальнейшего исследования.
Выбранный фрагмент выравнивания.

Полученное выравнивание в fasta-,msf- и gif-формате (с прошлого пратикума).
- Первый паттерн в
точности является фрагментом последовательности белка ECOT_ECOLI.
- Второй
("сильный") паттерн построим так, чтобы он распознавал все
белки выборки, и только их.
- Третий
("слабый") паттерн создаём на основе второго, сделав
требования к последовательности более мягкими.
Таблица:Паттерны и их поиск в Swiss-Prote
Характеристика
паттерна
|
Паттерн
|
В скольких
последовательностях банка Swiss-Prot найден мотив, удовлетворяющий
паттерну?
|
Все ли
последовательности из Вашего выравнивания найдены?
|
Фрагмент последовательности
(
119123 )
|
MMACPDGKKEKKFVTAYLGDA
|
20
|
Нет.Не найдено ни одной кроме моего белка.
|
Сильный
|
[MR]-M-A-C-[FP]-[ESGD]-[LGIQN]-[ATK]-[KEAR]-[KTERQ]-[ESIQKP]-[ARKQ]-[FP]-[VI]-[QASPT]-x(0,1)-x(0,1)-x(0,1)-[PG]-[DNE]-[EGDA]
|
35
|
Да, все 7 гомологов.
|
Слабый
|
M-A-C-[FP]-{AP}-{MH}-[ATK]-[KEAR]-X-X-X-[FP]-[VI]-{VL}-x(0,1)-x(0,1)-x(0,1)
|
42
|
Да,найдены все 7 гомологов.
|
При поиске первого паттерна был найден только мой белок,а также
близкородственные ему белки из серии ECOT_ECO** и ECOT_SHI**.
Как и следовало ожидать,при поиске второго,"сильного",паттерна
было найдено 35 белков,в том числе и все 7 гомологов.
Как это ни странно...Но при поиске "слабого" паттерна было
найдено всего-навсего 42 белка,причём последовательность "сильного"
паттерна была очень сильно ослаблена.Ну и естественно все 7 гомологов были
найдены.
Но больше всего меня удивило,что предыдущие две попытки давали тоже очень
маленькие результаты:36 и 37 последовательностей.
Все описанные в PROSITE мотивы в заданном белке ECOT_ECOL
Идентификатор документа PROSITE (AC)
|
Название мотива
|
Краткое описание мотива
|
Тип подписи (паттерн, профиль)
|
Паттерн (регулярное выражение)
|
Специфична ли подпись?
|
Сколько мотивов нашлось в белке?
|
PS00006
|
CK2_PHOSPHO_SITE
|
киназа казеина 2-ого сайта фосфорилирования
|
паттерн
|
[ST] - x(2) - [DE] [S or T is the phosphorylation site]
|
неспецифична
|
1
|
PS00005
|
PKC_PHOSPHO_SITE
|
белковая киназа сайта фосфорилирования
|
паттерн
|
[ST] -
x - [RK] S or T is the phosphorylation site
|
неспецифична
|
1
|
PS00001
|
ASN_GLYCOSYLATION
|
N-гликозиновый сайт
|
паттерн
|
N - {P}
- [ST] - {P} N is the glycosylation site
|
неспецифична
|
1
|
PS00007
|
TYR_PHOSPHO_SITE
|
тирозин-киназа сайта фосфорилирования
|
паттерн
|
[RK] -
x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y Y is the
phosphorylation site
|
неспецифична
|
1
|
PS00009
|
AMIDATION
|
амидный сайт
|
паттерн
|
x - G -
[RK] - [RK] x is the amidation site
|
неспецифична
|
1
|
По итогам поиска было найдено 5 паттернов.
Ни одного специфичного паттерна не найдено.
-
|