|
|
|
-
Как получить несколько последовательностей в формате FASTA на сервере
NCBI
Рассмотрите ту часть странички выдачи программы blastp, где
приведены выравнивания. Против последовательности с нужным
% идентичности поставьте галочку в пустую клеточку (check box).
Нажмите кнопку <Get selected Sequences> на этой же страничке.
На открывшейся страничке выберите в меню " Display"
пункт "FASTA", а в меню "Send to"
пункт "To File".
Создав файл, отредактируйте его, оставив в качестве названий
последовательностей (от ">" до первого пробела) только ID.
- Как запустить программу выравнивания muscle
Если последовательности находятся в файле orthologues.fasta в
текущей директории на kodomo-count, то после исполнения команды
muscle -in orthologues.fasta -out alignment.fasta
в файле alignment.fasta окажется выравнивание в FASTA-формате,
готовое к импорту в GeneDoc. Внимание: программа muscle не есть
часть пакета EMBOSS, и, в частности, не задает вопросов при запуске без
параметров
и не воспринимает последовательности в форматах, отличных от FASTA.
-
Как писать паттерны для поиска по белковому банку
См. Pattern syntax rules
на сайте PROSITE.
То же другими словами можно прочитать, выполнив (на kodomo-count)
команду fuzzpro -help.
-
Как искать последовательности по паттерну
Первый способ (online)
Откройте главную страничку базы данных
PROSITE.
Перейдите по гиперссылке "ScanProsite" (в разделе
"Tools for PROSITE"). На открывшейся странице введите
Введите Ваш паттерн в правое окошко и щелкните по кнопке "START
THE SCAN" (слева внизу). Ждите результата.
Второй способ (из командной строки)
На машине kodomo-count выполните команду
fuzzpro -pattern XXXXXX
(вместо XXXXXX вставьте свой паттерн).
Указание: в программе Putty одновременное нажатие
правой и левой кнопок мыши копирует содержимое буфера обмена в командную
строку.
На вопрос "Input sequences" ответьте “sw:*”
(что означает все последовательности банка Swiss-Prot). На вопрос
о допустимом числе несовпадений ("Number of mismatches")
ответьте по умолчанию (т.е., 0), на вопрос о выходном файле — как хотите.
- Как искать в данной последовательности мотивы, описанные
в банке PROSITE
Откройте главную страничку PROSITE.
Введите в нужное окошко AC, ID или последовательность Вашего белка.
Нажмите кнопку "Quick Scan".
Обращайте внимание на чекбокс "Exclude patterns with a high probability
of occurrence". Если в нем стоит галочка, то будут выданы только
"специфичные" мотивы — те, которые отвечают семействам белков
(один-два, а часто — ни одного).
В противном случае будут выданы также "неспецифичные", часто встречающиеся мотивы
(такие, как возможный сайт N-гликозилирования).
|
|