Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2011

Указания к занятию 6

1. Программы выравнивания пакета EMBOSS

В EMBOSS есть четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Программы needle и stretcher выдают оптимальное полное выравнивание, программа water — оптимальное частичное выравнивание, программа matcher выдаёт несколько (по умолчанию три) частичных выравниваний с наибольшим весом.

Все четыре программы можно запустить (с параметрами по умолчанию) примерно одинаковым образом. Например, вы хотите выровнять программой stretcher последовательности, находящиеся в файлах seq1.fasta и seq2.fasta. Для этого нужно выполнить команду:

Здесь alignment.stretcher — имя файла, в котором окажется результат. Общий синтаксис таков:

(если "-auto" опустить, то needle и water спросят, какие применять штрафы за пробелы). Здесь usa1 и usa2 — адреса (USA, см. следующий пункт) двух последовательностей, outfile — имя выходного файла.

2. Адрес последовательности (USA, univesal sequence address)

Примеры

"file.fasta" — единственная последовательность, находящаяся в файле "file.fasta".

"file.fasta:name" — последовательность из файла "file.fasta" с именем "name".

"file.fasta:name[15:73]" — участок с 15 по 73 буквы включительно из последовательность, имеющей в файле "file.fasta" имя "name".

"sw:p00000" — последовательность из подключённого банка данных "sw" (в нашем случае это Swiss-Prot), имеющая идентификатор "p00000" (в данном случае идентификатор — это либо ID, либо AC).

Список подключённых банков данных можно получить, выполнив команду showdb.