Учебный сайт Фоменко Елены
Главная | Семестры | Проекты | Заметки |
1. Создание паттернов аминокислотных последовательностей.
Рассмотрим в JalView множественное выравнивание, полученное при выполнении упражнения 1 прошлого занятия. Выберем фрагмент выравнивания:
Создаем три паттерна.
1. Первый паттерн в точности является фрагментом последовательности нашего белка.
2. Второй ("сильный") паттерн надо постараться построить так, чтобы он распознавал все белки выборки, и только их.
3. Третий ("слабый") паттерн надо создать на основе второго, сделав требования к последовательности более мягкими.
Стремиться надо к тому, чтобы паттерн находил всех близких родственников белка и не находил неродственные белки.
Основные правила синтаксиса (из prosite.expacy.org):
1. В PROSITE используются стандартные (IUPAK) однобуквенные коды аминокислот.
2. Символ "x" используется для позиций, где определенная аминокислота не выбрана.
3. Неопределенности указываются путем перечисления возможных в данной позиции аминокислот в квадратных скобках "[ ]".
4. Неопределенности также указываются перечислением в фигурных скобках "{ }" аминокислот, невозможных в данной позиции.
5. Каждый элемент паттерна отделяется от соседнего элемента символом "-". Если паттерн состоит только из однобуквенных аминокислотных
кодов, можно и без "-".
6. Повторение элементов паттерна может быть указано числовым занчением в скобках после элемента или, если есть гэпы, числовым диапазоном в скобках.
По результатам первого поиска получаем:
sp|P32153|FRVX_ECOLI 63 70 USERPAT1 . . . DEVGFMVT sp|P94521|YSDC_BACSU 70 77 USERPAT1 . . . DEVGFMVT sp|O34924|YTOP_BACSU 68 75 USERPAT1 . . . DEVGFMVT
После второго поиска получаем 190 результатов. Полагаю, их слишком много потому, что на выбранном участке консервативность слишком мала.
Вариантов получше не нашлось. Все белки из выравнивания нашлись.
По результатам третего поиска, получаем 1165 последовательностей. Паттерн можно было не ослаблять слишком сильно.
Таблица "Поиск по паттернам в банке данных Swiss-Prot":
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из выравнивания найдены (если нет, то сколько) |
Фрагмент последовательности | DEVGFMVT | 3 | Обе, соответствующие этому паттерну |
Сильный | [DE]-[EAQ]-[VLI]-[GH]-[FKLV]-[MFL]-[VL]-[TPVSR] | 190 | все 7 |
Слабый | [DE]-[EAQD]-[VLIM]-[GH]-[FKLV]-[MFL]-[VLI]-x | 1165 | все 7 |
2. Все описанные в PROSITE мотивы в заданном белке YSDC_BACSU.
Иденти- фикатор док.-та Prosite (AC) |
Назв. мотива | Краткое описание мотива |
Тип подписи (паттерн, профиль) | Паттерн | Специф. ли подпись? |
Сколько мотивов нашлось в белке? |
PS00008 | MYRISTYL | Сайт N-миристоилирования | паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | неспецифична | 12 |
PS00006 | CK2_PHOSPHO_SITE | Casein kinase II phosphorylation site | паттерн | [ST]-x(2)-[DE][SorTisthephosphorylationsite] | неспецифична | 8 |
PS00005 | PKC_PHOSPHO_SITE | Protein kinase C phosphorylation site | паттерн | [ST]-x-[RK] | неспецифична | 6 |
PS00004 | CAMP_PHOSPHO_SITE | cAMP- and cGMP-dependent protein kinase phosphorylation site | паттерн | [RK](2)-x-[ST] | неспецифична | 1 |
PS00007 | TYR_PHOSPHO_SITE | Tyrosine kinase phosphorylation site | паттерн | [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y | неспецифична | 1 |