Указания к занятию 6

  1. Программы выравнивания пакета EMBOSS

    В EMBOSS есть четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Программы needle и stretcher выдают оптимальное полное выравнивание, программа water — оптимальное частичное выравнивание, программа matcher выдаёт несколько (по умолчанию три) частичных выравниваний с наибольшим весом.

    Все четыре программы можно запустить (с параметрами по умолчанию) примерно одинаковым образом. Например, вы хотите выровнять программой stretcher последовательности, находящиеся в файлах seq1.fasta и seq2.fasta. Для этого нужно выполнить команду:

     stretcher seq1.fasta seq2.fasta alignment.stretcher -auto
    
    Здесь alignment.stretcher — имя файла, в котором окажется результат.

    Общий синтаксис таков:

     program usa1 usa2 outfile -auto
    
    (если "-auto" опустить, то needle и water спросят, какие применять штрафы за пробелы). Здесь usa1 и usa2 — адреса (USA, см. следующий пункт) двух последовательностей, outfile — имя выходного файла.

     

  2. Адрес последовательности (USA, univesal sequence address)

    Примеры

    "file.fasta" — единственная последовательность, находящаяся в файле "file.fasta".

    "file.fasta:name" — последовательность из файла "file.fasta" с именем "name".

    "file.fasta:name[15:73]" — участок с 15 по 73 буквы включительно из последовательность, имеющей в файле "file.fasta" имя "name".

    "sw:p00000" — последовательность из подключённого банка данных "sw" (в нашем случае это Swiss-Prot), имеющая идентификатор "p00000" (в данном случае идентификатор — это либо ID, либо AC).

    Список подключённых банков данных можно получить, выполнив команду showdb.