Учебный сайт Фоменко Елены

Главная Семестры Проекты Заметки

Паттерны и банк PROSITE.

1. Создание паттернов аминокислотных последовательностей.

Рассмотрим в JalView множественное выравнивание, полученное при выполнении упражнения 1 прошлого занятия. Выберем фрагмент выравнивания:

Создаем три паттерна.
1. Первый паттерн в точности является фрагментом последовательности нашего белка.
2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки выборки, и только их.
3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими. Стремиться надо к тому, чтобы паттерн находил всех близких родственников белка и не находил неродственные белки.

Основные правила синтаксиса (из prosite.expacy.org):
1. В PROSITE используются стандартные (IUPAK) однобуквенные коды аминокислот.
2. Символ "x" используется для позиций, где определенная аминокислота не выбрана.
3. Неопределенности указываются путем перечисления возможных в данной позиции аминокислот в квадратных скобках "[ ]".
4. Неопределенности также указываются перечислением в фигурных скобках "{ }" аминокислот, невозможных в данной позиции.
5. Каждый элемент паттерна отделяется от соседнего элемента символом "-". Если паттерн состоит только из однобуквенных аминокислотных кодов, можно и без "-".
6. Повторение элементов паттерна может быть указано числовым занчением в скобках после элемента или, если есть гэпы, числовым диапазоном в скобках.

По результатам первого поиска получаем:

sp|P32153|FRVX_ECOLI	63	70	USERPAT1	.	.	.	DEVGFMVT

sp|P94521|YSDC_BACSU	70	77	USERPAT1	.	.	.	DEVGFMVT

sp|O34924|YTOP_BACSU	68	75	USERPAT1	.	.	.	DEVGFMVT

После второго поиска получаем 190 результатов. Полагаю, их слишком много потому, что на выбранном участке консервативность слишком мала. Вариантов получше не нашлось. Все белки из выравнивания нашлись.
По результатам третего поиска, получаем 1165 последовательностей. Паттерн можно было не ослаблять слишком сильно.

Таблица "Поиск по паттернам в банке данных Swiss-Prot":

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из выравнивания найдены (если нет, то сколько)
Фрагмент последовательности DEVGFMVT 3 Обе, соответствующие этому паттерну
Сильный [DE]-[EAQ]-[VLI]-[GH]-[FKLV]-[MFL]-[VL]-[TPVSR] 190 все 7
Слабый [DE]-[EAQD]-[VLIM]-[GH]-[FKLV]-[MFL]-[VLI]-x 1165 все 7

2. Все описанные в PROSITE мотивы в заданном белке YSDC_BACSU.

Иденти-
фикатор док.-та Prosite (AC)
Назв. мотива Краткое
описание
мотива
Тип подписи (паттерн, профиль) Паттерн Специф.
ли подпись?
Сколько мотивов нашлось в белке?
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 12
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site паттерн [ST]-x(2)-[DE][SorTisthephosphorylationsite] неспецифична 8
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site паттерн [ST]-x-[RK] неспецифична 6
PS00004 CAMP_PHOSPHO_SITE cAMP- and cGMP-dependent protein kinase phosphorylation site паттерн [RK](2)-x-[ST] неспецифична 1
PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y неспецифична 1


© Фоменко Елена.