Пакет EMBOSS. Программы парного выравнивания




1. Расчет веса выравнивания.

Возьмем выравнивание из упражнения 1 предыдущего практикума:


Составим таблицу для подсчета веса выравнивания, в которой данные о весе сходных или идентичных аминокислотных остатков взяты из матрицы BLOSUM62, за открытие пробела при сваивается -12, за последующие пробелы -2.
seq1EQYVFADCAINIAPDSQDL--AE
seq2VQYVFGDCAIN---DSQGLEGAE
Вес-25746069446-12-2-2645-14-12-245
Вес выравнивания равен 46.

2. Построение оптимального выравнивания с помощью программы stretcher.

Пакет EMBOSS содержит четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Для посторения полного оптимального выравнивания используем программу stretcher.
Команда для получения выравнивания: stretcher seq1.fasta seq2.fasta alignment.stretcher - auto. Эта команда запрашивает последовательности из файлов seq1.fasta и seq2.fasta, строит выравнивание с автоматическими параметрами (штраф за пробел -12, последующие пробелы -2 ) и результат перенаправляет в файл alignment.stretcher

               10          20 
  seq1 EQYVFADCAINIAPDSQDL--AE
        ::.: :::::   ::: :  ::
  seq2 VQYIFGDCAIN---DSQGLEGAE
               10           20

Составленное мной выравнивание совпало с посторенным оптимальным выравниванием. (Ура!:))

3. Построение полного и частичного выравнивания с помощью программ needle и water для последовательности белка PTAS_BACSU и гомологичного ему белка PTA_STAAW.

Программы needle и water также входят в пакет из четырех программ EMBOSS. Программы needle предназначена для постраения оптимального полного парного выравнивания, а water - для оптимального частичного парного выравнивания.
Для посторениея в программе needle я использовала команду: needle sw:p39646 sw:q8nxw4 alignment_pta.needle -auto, которая извлекла из базы данных SwissProt последовательности белков PTAS_BACSU и PTA_STAAW, посторила выравнивание с автоматическими параментра(штраф за пробел -12, последующие пробелы -2) и результат отправила в файл alignment_pta.needle

PTAS_BACSU         1 MADLFSTVQEKVAGKDVKIVFPEGLDERILEAVSKLAGNKVLNPIVIGNE     50
                     ||||.:.:::|::||:||||.|||.|||:|.|.::|.....:.|||:|:|
PTAS_STAAW         1 MADLLNVLKDKLSGKNVKIVLPEGEDERVLTAATQLQATDYVTPIVLGDE     50

PTAS_BACSU        51 NEIQAKAKELNLTLGGVKIYDPHTYEGMEDLVQAFVERRKGKATEEQARK    100
                     .::|:.|::|:|.:..:::.:|.|.|...:|||:||||||||||||||::
PTAS_STAAW        51 TKVQSLAQKLDLDISNIELINPATSELKAELVQSFVERRKGKATEEQAQE    100

PTAS_BACSU       101 ALLDENYFGTMLVYKGLADGLVSGAAHSTADTVRPALQIIKTKEGVKKTS    150
                     .|.:.|||||||||.|.||||||||||||.|||||||||||||.||.:||
PTAS_STAAW       101 LLNNVNYFGTMLVYAGKADGLVSGAAHSTGDTVRPALQIIKTKPGVSRTS    150

PTAS_BACSU       151 GVFIMARGEEQYVFADCAINIAPDSQDLAEIAIESANTAKMFDIEPRVAM    200
                     |:|.|.:|:.||:|.|||||...|||.|||||:|||.:|..|.::|:|||
PTAS_STAAW       151 GIFFMIKGDVQYIFGDCAINPELDSQGLAEIAVESAKSALSFGMDPKVAM    200

PTAS_BACSU       201 LSFSTKGSAKSDETEKVADAVKIAKEKAP----ELTLDGEFQFDAAFVPS    246
                     ||||||||||||:..||.:|||:|::||.    |..:|||||||||.||.
PTAS_STAAW       201 LSFSTKGSAKSDDVTKVQEAVKLAQQKAEEEKLEAIIDGEFQFDAAIVPG    250

PTAS_BACSU       247 VAEKKAPDSEIKGDANVFVFPSLEAGNIGYKIAQRLGNFEAVGPILQGLN    296
                     |||||||.::::|||||||||||||||||||||||||.::||||:|||||
PTAS_STAAW       251 VAEKKAPGAKLQGDANVFVFPSLEAGNIGYKIAQRLGGYDAVGPVLQGLN    300

PTAS_BACSU       297 MPVNDLSRGCNAEDVYNLALITAAQAL-    323
                     .|||||||||:.||||||::||||||| 
PTAS_STAAW       301 SPVNDLSRGCSIEDVYNLSIITAAQALQ    328


Для посторениея в программе water я использовала команду: water sw:p39646 sw:q8nxw4 alignment_pta.water -auto, которая извлекла из базы данных SwissProt последовательности белков PTAS_BACSU и PTA_STAAW, посторила выравнивание с автоматическими параментра(штраф за пробел -12, последующие пробелы -2) и результат отправила в файл alignment_pta.water

PTAS_BACSU         1 MADLFSTVQEKVAGKDVKIVFPEGLDERILEAVSKLAGNKVLNPIVIGNE     50
                     ||||.:.:::|::||:||||.|||.|||:|.|.::|.....:.|||:|:|
PTAS_STAAW         1 MADLLNVLKDKLSGKNVKIVLPEGEDERVLTAATQLQATDYVTPIVLGDE     50

PTAS_BACSU        51 NEIQAKAKELNLTLGGVKIYDPHTYEGMEDLVQAFVERRKGKATEEQARK    100
                     .::|:.|::|:|.:..:::.:|.|.|...:|||:||||||||||||||::
PTAS_STAAW        51 TKVQSLAQKLDLDISNIELINPATSELKAELVQSFVERRKGKATEEQAQE    100

PTAS_BACSU       101 ALLDENYFGTMLVYKGLADGLVSGAAHSTADTVRPALQIIKTKEGVKKTS    150
                     .|.:.|||||||||.|.||||||||||||.|||||||||||||.||.:||
PTAS_STAAW       101 LLNNVNYFGTMLVYAGKADGLVSGAAHSTGDTVRPALQIIKTKPGVSRTS    150

PTAS_BACSU       151 GVFIMARGEEQYVFADCAINIAPDSQDLAEIAIESANTAKMFDIEPRVAM    200
                     |:|.|.:|:.||:|.|||||...|||.|||||:|||.:|..|.::|:|||
PTAS_STAAW       151 GIFFMIKGDVQYIFGDCAINPELDSQGLAEIAVESAKSALSFGMDPKVAM    200

PTAS_BACSU       201 LSFSTKGSAKSDETEKVADAVKIAKEKAP----ELTLDGEFQFDAAFVPS    246
                     ||||||||||||:..||.:|||:|::||.    |..:|||||||||.||.
PTAS_STAAW       201 LSFSTKGSAKSDDVTKVQEAVKLAQQKAEEEKLEAIIDGEFQFDAAIVPG    250

PTAS_BACSU       247 VAEKKAPDSEIKGDANVFVFPSLEAGNIGYKIAQRLGNFEAVGPILQGLN    296
                     |||||||.::::|||||||||||||||||||||||||.::||||:|||||
PTAS_STAAW       251 VAEKKAPGAKLQGDANVFVFPSLEAGNIGYKIAQRLGGYDAVGPVLQGLN    300

PTAS_BACSU       297 MPVNDLSRGCNAEDVYNLALITAAQAL    323
                     .|||||||||:.||||||::|||||||
PTAS_STAAW       301 SPVNDLSRGCSIEDVYNLSIITAAQAL    327

Частичное выравнивание составляют участки 1-323 белка PTAS_BACSU и 1-327 белка PTA_STAAW.
Локальное выравнивание совпадает с "ограничением" глобального на участок.
Вес глобального выравнивания равен 1090.2, а локального выравнивания - 1090.5. Вес глобального выравнивания будет всегда меньше веса локального выравнивания, так как глобальное выравнивание нацелено на сопоставление большего количества аминокислотных остатков, то есть в нем будет больше штрафов за пробелы.


© Butusova Anna,2012