Учебная страница курса биоинформатики,
год поступления 2011
Указания к занятию 6
1. Программы выравнивания пакета EMBOSS
В EMBOSS есть четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Программы needle и stretcher выдают оптимальное полное выравнивание, программа water — оптимальное частичное выравнивание, программа matcher выдаёт несколько (по умолчанию три) частичных выравниваний с наибольшим весом.
Все четыре программы можно запустить (с параметрами по умолчанию) примерно одинаковым образом. Например, вы хотите выровнять программой stretcher последовательности, находящиеся в файлах seq1.fasta и seq2.fasta. Для этого нужно выполнить команду:
stretcher seq1.fasta seq2.fasta alignment.stretcher -auto
Здесь alignment.stretcher — имя файла, в котором окажется результат. Общий синтаксис таков:
program usa1 usa2 outfile -auto
(если "-auto" опустить, то needle и water спросят, какие применять штрафы за пробелы). Здесь usa1 и usa2 — адреса (USA, см. следующий пункт) двух последовательностей, outfile — имя выходного файла.
2. Адрес последовательности (USA, univesal sequence address)
Примеры
"file.fasta" — единственная последовательность, находящаяся в файле "file.fasta".
"file.fasta:name" — последовательность из файла "file.fasta" с именем "name".
"file.fasta:name[15:73]" — участок с 15 по 73 буквы включительно из последовательность, имеющей в файле "file.fasta" имя "name".
"sw:p00000" — последовательность из подключённого банка данных "sw" (в нашем случае это Swiss-Prot), имеющая идентификатор "p00000" (в данном случае идентификатор — это либо ID, либо AC).
Список подключённых банков данных можно получить, выполнив команду showdb.