Подсказки к занятию 11

 
     

  1. Как получить несколько последовательностей в формате FASTA на сервере NCBI
  2. Рассмотрите ту часть странички выдачи программы blastp, где приведены выравнивания. Против последовательности с нужным % идентичности поставьте галочку в пустую клеточку (check box).
    Нажмите кнопку <Get selected Sequences> на этой же страничке.
    На открывшейся страничке выберите в меню " Display" пункт "FASTA", а в меню "Send to" пункт "To File".

    Создав файл, отредактируйте его, оставив в качестве названий последовательностей (от ">" до первого пробела) только ID.
     

  3. Как запустить программу выравнивания muscle
  4. Если последовательности находятся в файле orthologues.fasta в текущей директории на kodomo-count, то после исполнения команды
      muscle -in orthologues.fasta -out alignment.fasta
    
    в файле alignment.fasta окажется выравнивание в FASTA-формате, готовое к импорту в GeneDoc. Внимание: программа muscle не есть часть пакета EMBOSS, и, в частности, не задает вопросов при запуске без параметров и не воспринимает последовательности в форматах, отличных от FASTA.

  5. Как писать паттерны для поиска по белковому банку
  6. См. Pattern syntax rules на сайте PROSITE.

    То же другими словами можно прочитать, выполнив (на kodomo-count) команду fuzzpro -help.
     

  7. Как искать последовательности по паттерну
  8. Первый способ (online)

    Откройте главную страничку базы данных PROSITE. Перейдите по гиперссылке "ScanProsite" (в разделе "Tools for PROSITE"). На открывшейся странице введите Введите Ваш паттерн в правое окошко и щелкните по кнопке "START THE SCAN" (слева внизу). Ждите результата.

    Второй способ (из командной строки)

    На машине kodomo-count выполните команду
     fuzzpro -pattern XXXXXX
    
    (вместо XXXXXX вставьте свой паттерн). Указание: в программе Putty одновременное нажатие правой и левой кнопок мыши копирует содержимое буфера обмена в командную строку.

    На вопрос "Input sequences" ответьте “sw:*” (что означает все последовательности банка Swiss-Prot). На вопрос о допустимом числе несовпадений ("Number of mismatches") ответьте по умолчанию (т.е., 0), на вопрос о выходном файле — как хотите.

  9. Как искать в данной последовательности мотивы, описанные в банке PROSITE
  10. Откройте главную страничку PROSITE. Введите в нужное окошко AC, ID или последовательность Вашего белка. Нажмите кнопку "Quick Scan".

    Обращайте внимание на чекбокс "Exclude patterns with a high probability of occurrence". Если в нем стоит галочка, то будут выданы только "специфичные" мотивы — те, которые отвечают семействам белков (один-два, а часто — ни одного). В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы (такие, как возможный сайт N-гликозилирования).