Возьмем выравнивание из упражнения 1 предыдущего практикума:
seq1 | E | Q | Y | V | F | A | D | C | A | I | N | I | A | P | D | S | Q | D | L | - | - | A | E |
seq2 | V | Q | Y | V | F | G | D | C | A | I | N | - | - | - | D | S | Q | G | L | E | G | A | E |
Вес | -2 | 5 | 7 | 4 | 6 | 0 | 6 | 9 | 4 | 4 | 6 | -12 | -2 | -2 | 6 | 4 | 5 | -1 | 4 | -12 | -2 | 4 | 5 |
Пакет EMBOSS содержит четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Для посторения полного оптимального выравнивания используем программу stretcher.
Команда для получения выравнивания: stretcher seq1.fasta seq2.fasta alignment.stretcher - auto. Эта команда запрашивает последовательности из файлов seq1.fasta и seq2.fasta, строит выравнивание с автоматическими параметрами (штраф за пробел -12, последующие пробелы -2 ) и результат перенаправляет в файл alignment.stretcher
10 20 seq1 EQYVFADCAINIAPDSQDL--AE ::.: ::::: ::: : :: seq2 VQYIFGDCAIN---DSQGLEGAE 10 20
Программы needle и water также входят в пакет из четырех программ EMBOSS. Программы needle предназначена для постраения оптимального полного парного выравнивания, а water - для оптимального частичного парного выравнивания.
Для посторениея в программе needle я использовала команду: needle sw:p39646 sw:q8nxw4 alignment_pta.needle -auto, которая извлекла из базы данных SwissProt последовательности белков PTAS_BACSU и PTA_STAAW, посторила выравнивание с автоматическими параментра(штраф за пробел -12, последующие пробелы -2) и результат отправила в файл alignment_pta.needle
PTAS_BACSU 1 MADLFSTVQEKVAGKDVKIVFPEGLDERILEAVSKLAGNKVLNPIVIGNE 50 ||||.:.:::|::||:||||.|||.|||:|.|.::|.....:.|||:|:| PTAS_STAAW 1 MADLLNVLKDKLSGKNVKIVLPEGEDERVLTAATQLQATDYVTPIVLGDE 50 PTAS_BACSU 51 NEIQAKAKELNLTLGGVKIYDPHTYEGMEDLVQAFVERRKGKATEEQARK 100 .::|:.|::|:|.:..:::.:|.|.|...:|||:||||||||||||||:: PTAS_STAAW 51 TKVQSLAQKLDLDISNIELINPATSELKAELVQSFVERRKGKATEEQAQE 100 PTAS_BACSU 101 ALLDENYFGTMLVYKGLADGLVSGAAHSTADTVRPALQIIKTKEGVKKTS 150 .|.:.|||||||||.|.||||||||||||.|||||||||||||.||.:|| PTAS_STAAW 101 LLNNVNYFGTMLVYAGKADGLVSGAAHSTGDTVRPALQIIKTKPGVSRTS 150 PTAS_BACSU 151 GVFIMARGEEQYVFADCAINIAPDSQDLAEIAIESANTAKMFDIEPRVAM 200 |:|.|.:|:.||:|.|||||...|||.|||||:|||.:|..|.::|:||| PTAS_STAAW 151 GIFFMIKGDVQYIFGDCAINPELDSQGLAEIAVESAKSALSFGMDPKVAM 200 PTAS_BACSU 201 LSFSTKGSAKSDETEKVADAVKIAKEKAP----ELTLDGEFQFDAAFVPS 246 ||||||||||||:..||.:|||:|::||. |..:|||||||||.||. PTAS_STAAW 201 LSFSTKGSAKSDDVTKVQEAVKLAQQKAEEEKLEAIIDGEFQFDAAIVPG 250 PTAS_BACSU 247 VAEKKAPDSEIKGDANVFVFPSLEAGNIGYKIAQRLGNFEAVGPILQGLN 296 |||||||.::::|||||||||||||||||||||||||.::||||:||||| PTAS_STAAW 251 VAEKKAPGAKLQGDANVFVFPSLEAGNIGYKIAQRLGGYDAVGPVLQGLN 300 PTAS_BACSU 297 MPVNDLSRGCNAEDVYNLALITAAQAL- 323 .|||||||||:.||||||::||||||| PTAS_STAAW 301 SPVNDLSRGCSIEDVYNLSIITAAQALQ 328
PTAS_BACSU 1 MADLFSTVQEKVAGKDVKIVFPEGLDERILEAVSKLAGNKVLNPIVIGNE 50 ||||.:.:::|::||:||||.|||.|||:|.|.::|.....:.|||:|:| PTAS_STAAW 1 MADLLNVLKDKLSGKNVKIVLPEGEDERVLTAATQLQATDYVTPIVLGDE 50 PTAS_BACSU 51 NEIQAKAKELNLTLGGVKIYDPHTYEGMEDLVQAFVERRKGKATEEQARK 100 .::|:.|::|:|.:..:::.:|.|.|...:|||:||||||||||||||:: PTAS_STAAW 51 TKVQSLAQKLDLDISNIELINPATSELKAELVQSFVERRKGKATEEQAQE 100 PTAS_BACSU 101 ALLDENYFGTMLVYKGLADGLVSGAAHSTADTVRPALQIIKTKEGVKKTS 150 .|.:.|||||||||.|.||||||||||||.|||||||||||||.||.:|| PTAS_STAAW 101 LLNNVNYFGTMLVYAGKADGLVSGAAHSTGDTVRPALQIIKTKPGVSRTS 150 PTAS_BACSU 151 GVFIMARGEEQYVFADCAINIAPDSQDLAEIAIESANTAKMFDIEPRVAM 200 |:|.|.:|:.||:|.|||||...|||.|||||:|||.:|..|.::|:||| PTAS_STAAW 151 GIFFMIKGDVQYIFGDCAINPELDSQGLAEIAVESAKSALSFGMDPKVAM 200 PTAS_BACSU 201 LSFSTKGSAKSDETEKVADAVKIAKEKAP----ELTLDGEFQFDAAFVPS 246 ||||||||||||:..||.:|||:|::||. |..:|||||||||.||. PTAS_STAAW 201 LSFSTKGSAKSDDVTKVQEAVKLAQQKAEEEKLEAIIDGEFQFDAAIVPG 250 PTAS_BACSU 247 VAEKKAPDSEIKGDANVFVFPSLEAGNIGYKIAQRLGNFEAVGPILQGLN 296 |||||||.::::|||||||||||||||||||||||||.::||||:||||| PTAS_STAAW 251 VAEKKAPGAKLQGDANVFVFPSLEAGNIGYKIAQRLGGYDAVGPVLQGLN 300 PTAS_BACSU 297 MPVNDLSRGCNAEDVYNLALITAAQAL 323 .|||||||||:.||||||::||||||| PTAS_STAAW 301 SPVNDLSRGCSIEDVYNLSIITAAQAL 327