Подсказки к занятию 10 "Паттерны и профили"
Синтаксис паттерна
См. Pattern syntax rules
на сайте PROSITE.
То же другими словами можно прочитать, выполнив (на kodomo-count)
команду fuzzpro -help.
Как "усилить" или "ослабить" паттерн? (советы, а не инструкции)
В сильный паттерн имеет смысл включить все позиции выбранного
фрагмента выравнивания, а в каждой позиции
(кроме, разумеется, тех, в которых оказались гэпы)
разрешить все буквы, встретившиеся в какой-либо из
последовательностей.
При создании слабого паттерна можно
пользоваться (одновременно или по отдельности) следующими приёмами:
в позициях,
в которых все 5 букв оказались разными, заменить 5 букв в квадратных скобках
буквой X;
сократить паттерн,
убрав по 23 позиции с каждого из концов;
вместо, например, [RKYW] написать {AG}
(то есть если Вы видите, что в вашей выборке
все остатки в данной позиции обладают большой боковой цепью,
то вместо перечисления всех встретившихся букв напишите запрет
на маленькие остатки)
и т.п.
-
Как искать последовательности по паттерну?
Первый способ (online)
Откройте главную страничку базы данных
PROSITE.
Перейдите по гиперссылке "ScanProsite" (в разделе
"Tools for PROSITE"). На открывшейся странице введите
Ваш паттерн в правое окошко и проверьте, что поиск будет идти по SwissProt. Ниже в выпадающем меню имеет смысл выбрать в качестве формата
выдачи результатов формат "Plain text tabular". Щелкните по кнопке "START
THE SCAN" (слева внизу). Ждите результата.
Второй способ (из командной строки)
На машине kodomo-count выполните команду
fuzzpro -pattern XXXXXX
(вместо XXXXXX вставьте свой паттерн).
Указание: в программе Putty одновременное нажатие
правой и левой кнопок мыши копирует содержимое буфера обмена в командную
строку.
На вопрос "Input sequences" ответьте "sw:*"
(что означает все последовательности банка Swiss-Prot). На вопрос
о допустимом числе несовпадений ("Number of mismatches")
ответьте по умолчанию (т.е., 0), на вопрос о выходном файле - как хотите.
-
Как искать в данной последовательности мотивы, описанные
в банке PROSITE?
Откройте главную страничку PROSITE.
Введите в нужное окошко AC, ID или последовательность Вашего белка.
Нажмите кнопку "Quick Scan".
Обращайте внимание на чекбокс "Exclude patterns with a high probability
of occurrence". Если в нем стоит галочка, то будут выданы только
"специфичные" мотивы - те, которые отвечают семействам белков
(один-два, а часто - ни одного).
В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы
(такие, как возможный сайт N-гликозилирования).
|