Указания к занятию 9

  1. Как с помощью GeneDoc получить картинку с изображением выбранного фрагмента выравнивания
  2. Прежде всего, проследите, что названиями последовательноcтей служат ID записей Swiss-Prot. Если это не так, откройте Project → Edit Sequences List, в открывшемся окошке "Sequence Dialog" (оно открывается также нажатием <Ctrl+Q>) можно не только менять порядок расположения последовательностей, удалять ненужные и т.п., но и редактировать их имена, для этого надо выполнить двойной щелчок левой кнопкой мыши по имени. Чтобы завершить редактирование списка последовательностей, нажмите кнопку "DONE".

    GeneDoc позволяет сохранить в виде картинки только целый блок выравнивания (блоком в GeneDoc называется один из кусков, на которые разбивается выравнивания, чтобы оно помещалось по ширине в окне). Ширину блоков можно регулировать либо изменением ширины окна программы, либо выбрав в меню Project → Configure (<Ctrl+G>) "Fixed" в разделе "Seq Block Sizing".

    Подберите ширину блока так, чтобы выбранный фрагмент был примерно в середине какого-нибудь блока. Пометьте как-нибудь границы выбранного фрагмента. Например, можно выбрать в меню Shade "Manual shade mode", затем нажать на "Back" или "Text" и выбрать какой-нибудь яркий цвет, после чего, щелкая по буквам на границе фрагмента, вы будете их перекрашивать соответствующим образом. Можно также вписать звёздочки или другие символы в строку консенсуса (ниже выравнивания) или в строку нумерации (выше выравнивания), отметив таким образом колонки, не входящие (или, наоборот, входящие) во фрагмент. Желательно всё же, чтобы нумерация фрагмента при этом не пропала. Чтобы писать в эти строки, достаточно сделать двойной щелчок в нужное место. Не забудьте указать в отчёте, как именно выделен ваш фрагмент!

    Как сохранить полученное изображение, см. в подсказках к предыдущим заданиям. Есть и другой вариант: в меню Edit выбрать "Copy selected blocks to HTML" и создать HTML-файл (или его фрагмент) с изображением выравнивания.

     

  3. Синтаксис паттерна
  4. См. Pattern syntax rules на сайте PROSITE.

    То же другими словами можно прочитать, выполнив на kodomo команду fuzzpro -help.
     

  5. Как "усилить" или "ослабить" паттерн? (советы, а не инструкции)
  6. В сильный паттерн имеет смысл включить все позиции выбранного фрагмента выравнивания, а в каждой позиции (кроме, разумеется, тех, в которых оказались гэпы) разрешить все буквы, встретившиеся в этой позиции, и только их.

    При создании слабого паттерна можно пользоваться (одновременно или по отдельности) следующими приёмами:
     –    в позициях, в которых 5 или более разных букв, заменить эти буквы в квадратных скобках буквой X;
     –   сократить паттерн, убрав по 2–3 позиции с каждого из концов;
     –   модифицировать паттерн, исходя из ваших знаний о родстве аминокислот, например, вместо [IL] можно попробовать написать [ILMV], вместо [NS] — [NST] и т.п.
     –   иногда можно вместо, например, [RKYW] написать {AG} (то есть если Вы видите, что в вашей выборке все остатки в данной позиции обладают большой боковой цепью, то вместо перечисления всех встретившихся букв напишите запрет на маленькие остатки)
     –   если выбранный фрагмент содержит пропуск, то можно ослабить условия на него, например, вместо x(2,3) написать x(1,5)
    и т.п.

     

  7. Как искать последовательности по паттерну?
  8. Первый способ (online)

    Откройте главную страничку базы данных PROSITE. Перейдите по гиперссылке "ScanProsite" (в разделе "Tools for PROSITE"). На открывшейся странице введите Ваш паттерн в правое окошко и проверьте, что поиск будет идти по Swiss-Prot. Ниже в выпадающем меню имеет смысл выбрать в качестве формата выдачи результатов формат "Plain text tabular". Щелкните по кнопке "START THE SCAN" (слева внизу). Ждите результата.

    Второй способ (на машине kodomo)

    Выполните команду:

     fuzzpro -pattern XXXXXX
    
    (вместо XXXXXX вставьте свой паттерн). Указание: в программе Putty одновременное нажатие правой и левой кнопок мыши копирует содержимое буфера обмена в командную строку.

    На вопрос "Input sequences" ответьте "sw:*" (что означает все последовательности банка Swiss-Prot). На вопрос о допустимом числе несовпадений ("Number of mismatches") ответьте по умолчанию (т.е., 0), на вопрос о выходном файле — как хотите.

     

  9. Как искать в данной последовательности мотивы, описанные в банке PROSITE?
  10. Откройте главную страничку PROSITE. Введите в нужное окошко AC, ID или последовательность Вашего белка. Нажмите кнопку "Quick Scan".

    Обращайте внимание на чекбокс "Exclude patterns with a high probability of occurrence". Если в нем стоит галочка, то будут выданы только "специфичные" мотивы — те, которые отвечают семействам белков (один-два, а часто — ни одного). В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы (такие, как возможный сайт N-гликозилирования).