Подсказки к занятию 9 "Паттерны и профили"

  1. Синтаксис паттерна

    См. Pattern syntax rules на сайте PROSITE.

    То же другими словами можно прочитать, выполнив (на kodomo-count) команду fuzzpro -help.
     

  2. Как "усилить" или "ослабить" паттерн? (советы, а не инструкции)

    В сильный паттерн имеет смысл включить все позиции выбранного фрагмента выравнивания, а в каждой позиции (кроме, разумеется, тех, в которых оказались гэпы) разрешить все буквы, встретившиеся в какой-либо из последовательностей.

    При создании слабого паттерна можно пользоваться (одновременно или по отдельности) следующими приёмами:
     –    в позициях, в которых все 5 букв оказались разными, заменить 5 букв в квадратных скобках буквой X;
     –   сократить паттерн, убрав по 2–3 позиции с каждого из концов;
     –   вместо, например, [RKYW] написать {AG} (то есть если Вы видите, что в вашей выборке все остатки в данной позиции обладают большой боковой цепью, то вместо перечисления всех встретившихся букв напишите запрет на маленькие остатки)
    и т.п.

  3. Как искать последовательности по паттерну?

    Первый способ (online)

    Откройте главную страничку базы данных PROSITE. Перейдите по гиперссылке "ScanProsite" (в разделе "Tools for PROSITE"). На открывшейся странице введите Ваш паттерн в правое окошко и проверьте, что поиск будет идти по SwissProt. Ниже в выпадающем меню имеет смысл выбрать в качестве формата выдачи результатов формат "Plain text tabular".
    Щелкните по кнопке "START THE SCAN" (слева внизу). Ждите результата.

    Второй способ (из командной строки)

    На машине kodomo-count выполните команду

     fuzzpro -pattern XXXXXX
    
    (вместо XXXXXX вставьте свой паттерн). Указание: в программе Putty одновременное нажатие правой и левой кнопок мыши копирует содержимое буфера обмена в командную строку.

    На вопрос "Input sequences" ответьте "sw:*" (что означает все последовательности банка Swiss-Prot). На вопрос о допустимом числе несовпадений ("Number of mismatches") ответьте по умолчанию (т.е., 0), на вопрос о выходном файле - как хотите.

  4. Как искать в данной последовательности мотивы, описанные в банке PROSITE?

    Откройте главную страничку PROSITE. Введите в нужное окошко AC, ID или последовательность Вашего белка. Нажмите кнопку "Quick Scan".

    Обращайте внимание на чекбокс "Exclude patterns with a high probability of occurrence". Если в нем стоит галочка, то будут выданы только "специфичные" мотивы — те, которые отвечают семействам белков (один-два, а часто — ни одного). В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы (такие, как возможный сайт N-гликозилирования).