Пакет EMBOSS. Программы парного выравнивания



1. Подсчет веса выравнивания

Первая строка выравнивания - - I N - H D G K L D Q A F A L I D A A A E A G
Вторая строка выравнивания G R I N F H D G K L G - - - - L I D M M A E A A
Веса позиций выравнивания -12 -2 4 6 -12 8 6 6 5 4 -1 -12 -2 -2 -2 4 4 6 -1 -1 4 5 4 0

Вес выравнивания - 19

В EMBOSS есть четыре программы, выдающие парное выравнивание:
needle - оптимальное полное выравнивание
water - оптимальное частичное выравнивание
stretcher - оптимальное полное выравнивание
matcher - несколько (по умолчанию три) частичных выравниваний с наибольшим весом.

2. Построение выравнивания с помощью программы stretcher.
Создадим программой stretcher оптимальное выравнивание тех же последовательностей seq1 и seq2 (по умолчанию программа stretcher использует те же параметры: матрица BLOSUM62, штрафы 12 и 2). Для этого используем следущую команду:
stretcher seq1.fasta seq2.fasta alignment.stretcher -auto
Получен файл alignment.stretcher, в конце которого - выравнивание, построенное программой stretcher :
########################################
# Program: stretcher
# Rundate: Thu 29 Mar 2012 22:33:19
# Commandline: stretcher
#    [-asequence] seq1.fasta
#    [-bsequence] seq2.fasta
#    [-outfile] alignment.stretcher
#    -auto
# Align_format: markx0
# Report_file: alignment.stretcher
########################################

#=======================================
#
# Aligned_sequences: 2
# 1: 
# 2: 
# Matrix: EBLOSUM62
# Gap_penalty: 12
# Extend_penalty: 2
#
# Length: 24
# Identity:      13/24 (54.2%)
# Similarity:    13/24 (54.2%)
# Gaps:           7/24 (29.2%)
# Score: 20
# 
#
#=======================================

                  10        20 
       --IN-HDGKLDQAFALIDAAAEAG
         :: :::::     :::  ::: 
       GRINFHDGKL----GLIDMMAEAA
               10            20


#---------------------------------------
#---------------------------------------
Вес выравнивания, построенного программой - 20 (лучше, чем мое выравнивание)

3. Построение выравниваний с помощью программ needle и water.
Для построения полного выравнивания последовательностей белка SPSE_BACSU и родственного ему белка SIAS_HUMAN выполним команду:
needle sw:spse_bacsu sw:sias_human bigalignment.needle -auto
Программа выдаст нам файл alignmentneedle.txt, в котором можно увидеть полученное полное выравнивание:
#=======================================

SPSE_BACSU         1 --MAAFQIANKTVGKDAPVFIIAEAGINHDGKLDQAFALIDAAAEAGADA     48
                       :.......:.||...|.|||||.|.||.|.||.|..:|..|.|.|||.
SIAS_HUMAN         1 MPLELELCPGRWVGGQHPCFIIAEIGQNHQGDLDVAKRMIRMAKECGADC     50

SPSE_BACSU        49 VKFQM----FQADRMYQKDPGLYKTAAGKDVSIFSLVQSMEMPAEWILPL     94
                     .|||.    |:.:|...:.|...|.:.||......  :.:|...:....|
SIAS_HUMAN        51 AKFQKSELEFKFNRKALERPYTSKHSWGKTYGEHK--RHLEFSHDQYREL     98

SPSE_BACSU        95 LDYCREKQVIFLSTVCDEGSADLLQSTSPSAFKIASYEINHLPLLKYVAR    144
                     ..|..|..:.|.::..||.:.:.|...:...||:.|.:.|:.|.|:..|:
SIAS_HUMAN        99 QRYAEEVGIFFTASGMDEMAVEFLHELNVPFFKVGSGDTNNFPYLEKTAK    148

SPSE_BACSU       145 LNRPMIFSTAGAEISDVHEAWRTIRAEGNNQIAIMHCVAKYPAPPEYSNL    194
                     ..|||:.|:....:..:.:.::.::.. |.....:.|.:.||..||..||
SIAS_HUMAN       149 KGRPMVISSGMQSMDTMKQVYQIVKPL-NPNFCFLQCTSAYPLQPEDVNL    197

SPSE_BACSU       195 SVIPMLAAAFPEAVIGFSDHSEHPTEAPCAAVRLGAKLIEKHFTIDKNLP    244
                     .||......||:..||:|.| |.......|||.||||::|:|.|:||...
SIAS_HUMAN       198 RVISEYQKLFPDIPIGYSGH-ETGIAISVAAVALGAKVLERHITLDKTWK    246

SPSE_BACSU       245 GADHSFALNPDELKEMVDGIRKTEAELKQGITKPVSEKLLGSSYKTTTAI    294
                     |:|||.:|.|.||.|:|..:|             :.|:.|||..|.....
SIAS_HUMAN       247 GSDHSASLEPGELAELVRSVR-------------LVERALGSPTKQLLPC    283

SPSE_BACSU       295 EGEIRNFAYRGIFTTAPIQKGEAFSEDNIAVLRPGQKPQGLHPR-FFELL    343
                     |........:.:.....|.:|...:.|.:.| :.|: |:|..|. .|.|:
SIAS_HUMAN       284 EMACNEKLGKSVVAKVKIPEGTILTMDMLTV-KVGE-PKGYPPEDIFNLV    331

SPSE_BACSU       344 TSGVRAVRDIPADTGIVWDDILLKDSPFHE------    373
                     ...|...        :..||.::::...:.      
SIAS_HUMAN       332 GKKVLVT--------VEEDDTIMEELVDNHGKKIKS    359


#---------------------------------------
#---------------------------------------
Вес выравнивания 346

Для построения частичного выравнивания последовательностей белка SPSE_BACSU и родственного ему белка SIAS_HUMAN выполним команду:
water sw:spse_bacsu sw:sias_human bigalignment.water -auto
Программа выдаст нам файл bigalignmentwater.txt, в котором можно увидеть полученное частичное выравнивание:

=======================================

SPSE_BACSU        11 VGKDAPVFIIAEAGINHDGKLDQAFALIDAAAEAGADAVKFQM----FQA     56
                     ||...|.|||||.|.||.|.||.|..:|..|.|.|||..|||.    |:.
SIAS_HUMAN        13 VGGQHPCFIIAEIGQNHQGDLDVAKRMIRMAKECGADCAKFQKSELEFKF     62

SPSE_BACSU        57 DRMYQKDPGLYKTAAGKDVSIFSLVQSMEMPAEWILPLLDYCREKQVIFL    106
                     :|...:.|...|.:.||......  :.:|...:....|..|..|..:.|.
SIAS_HUMAN        63 NRKALERPYTSKHSWGKTYGEHK--RHLEFSHDQYRELQRYAEEVGIFFT    110

SPSE_BACSU       107 STVCDEGSADLLQSTSPSAFKIASYEINHLPLLKYVARLNRPMIFSTAGA    156
                     ::..||.:.:.|...:...||:.|.:.|:.|.|:..|:..|||:.|:...
SIAS_HUMAN       111 ASGMDEMAVEFLHELNVPFFKVGSGDTNNFPYLEKTAKKGRPMVISSGMQ    160

SPSE_BACSU       157 EISDVHEAWRTIRAEGNNQIAIMHCVAKYPAPPEYSNLSVIPMLAAAFPE    206
                     .:..:.:.::.::.. |.....:.|.:.||..||..||.||......||:
SIAS_HUMAN       161 SMDTMKQVYQIVKPL-NPNFCFLQCTSAYPLQPEDVNLRVISEYQKLFPD    209

SPSE_BACSU       207 AVIGFSDHSEHPTEAPCAAVRLGAKLIEKHFTIDKNLPGADHSFALNPDE    256
                     ..||:|.| |.......|||.||||::|:|.|:||...|:|||.:|.|.|
SIAS_HUMAN       210 IPIGYSGH-ETGIAISVAAVALGAKVLERHITLDKTWKGSDHSASLEPGE    258

SPSE_BACSU       257 LKEMVDGIRKTEAELKQGITKPVSEKLLGSSYKTTTAIEGEIRNFAYRGI    306
                     |.|:|..:|             :.|:.|||..|.....|........:.:
SIAS_HUMAN       259 LAELVRSVR-------------LVERALGSPTKQLLPCEMACNEKLGKSV    295

SPSE_BACSU       307 FTTAPIQKGEAFSEDNIAVLRPGQKPQGLHP    337
                     .....|.:|...:.|.:.| :.|: |:|..|
SIAS_HUMAN       296 VAKVKIPEGTILTMDMLTV-KVGE-PKGYPP    324


#---------------------------------------
#---------------------------------------
Вес выравнивания 363


В частичное выравнивание вошёл участок последовательности моего белка от 11 до 337 а/о и родственного ему от 13 до 324 а/о.
Локальное выравнивание совпадает с "ограничением" глобального на этот участок.
Больший вес имеет локальное выравнивание (363 у локального и 346 у глобального).
Вес оптимального глобального выравнивания не может быть больше веса оптимального локального выравнивая, тк в глобальном выравнивании гораздо больше участков, которые "минусуют" общий вес выравнивания.