1. Подсчёт веса выравнивания.
Посчитаем вес выравнивания, полученного в упр.1 предыдущего занятия, используя матрицу BLOSUM62.
Штраф за открытие пробела 12 и штраф за удлинение пробела 2.
Файлы коротких последовательностей: seq1.fasta, seq2.fasta
alignment1
seq1 - V T T S N D P T A H A E - - V T A I R K A
seq2 I V T E S N D - - A H A E S F V T N I M K A
Вес -12 4 5 -1 4 6 6 -12 -2 4 8 4 5 -12 -2 4 5 -2 4 -1 5 4
Общий вес выравнивания=-12+4+5-1+4+6+6-12-2+4+8+4+5-12-2+4+5-2+4-1+5+4=24


В EMBOSS есть четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Программы needle и stretcher выдают оптимальное полное выравнивание, программа water — оптимальное частичное выравнивание, программа matcher выдаёт несколько (по умолчанию три) частичных выравниваний с наибольшим весом.


2. Построение выравнивания с помощью программы stretcher.
Создадим программой stretcher оптимальное выравнивание тех же последовательностей seq1 и seq2 (NB! по умолчанию программа stretcher использует те же параметры: матрица BLOSUM62, штрафы 12 и 2). Для этого используем следущую команду:
stretcher seq1.fasta seq2.fasta alignment.stretcher -auto
Программа выдасть нам такой файл alignment.stretcher, в конце которого мы увидим выравнивание, построенное программой stretcher :
#
# Length: 20
# Identity:      10/20 (50.0%)
# Similarity:    12/20 (60.0%)
# Gaps:           1/20 ( 5.0%)
# Score: 30
# 
#---------------------------------------
                10         
  SEQ1 VTT-SNDPTAHAEVTAIRKA
       . : :::  : . :: : ::
  SEQ2 IVTESNDAHAESFVTNIMKA
               10        20
#---------------------------------------
Заметим, что вес выравнивания, построенный программой 30 (в то время как мой - 24), это значит, что выранивание, построенное программой лучше.

3. Построение выравниваний с помощью программ needle и water.
Для построения полного выравнивания последовательностей белка GUAD_BACSU и родственного ему белка ADAT3_MOUSE выполним команду:
needle sw:guad_bacsu sw:adat3_mouse bigalignment.needle -auto
Программа выдаст нам файл bigalignment.needle, в котором можно увидеть полученное полное выравнивание:
#=======================================

GUAD_BACSU         0 --------------------------------------------------      0
                                                                       
ADAT3_MOUSE        1 MEPTSGFAEQPGPVKAESEEQEPAQWQALPVLSEQQSGAVELILAYAAPV     50

GUAD_BACSU         0 --------------------------------------------------      0
                                                                       
ADAT3_MOUSE       51 LDKRQTSRLLREVSAVYPLPAQPHLKRVRPSRSAGGAQSSDLLLCLAGPS    100

GUAD_BACSU         0 --------------------------------------------------      0
                                                                       
ADAT3_MOUSE      101 AGPRSLAELLPRPAVDPRGLGTPFLVPVPARPPLTRSQFEEARAHWPTSF    150

GUAD_BACSU         1 --------------------MNHETFLKRAVTLACEGVNAGIGGPFGAVI     30
                                         ...:|.::|||..|......|:.. .|||:
ADAT3_MOUSE      151 HEDKQVTSALAGQLFSTQERAAMQTHMERAVCAAQRAAAQGLRA-VGAVV    199

GUAD_BACSU        31 VKDGA--IIAEGQNNVTTSNDPTAHAEVTAI----------------RKA     62
                     |...:  ::|.| ::.::...|..||.:..|                ..|
ADAT3_MOUSE      200 VDPASDRVLATG-HDCSSVASPLLHAVMVCIDLVAQGQGRGSCDLRSHPA    248

GUAD_BACSU        63 CKVLGA-----------YQLDD------CI---LYTSCEPCPMCLGAIYW     92
                     |....|           .:||:      |.   ||.:.|||.||..|:..
ADAT3_MOUSE      249 CSFTQATATQGARAGSVRKLDEDSLPYVCTGYDLYVTREPCVMCAMALVH    298

GUAD_BACSU        93 ARPKAVFYAAEHTDAAEAGFDDSFIYKEIDKPAEERTIPFYQVTLTE---    139
                     ||.:.|||.|...|.|.     ..:::...:|........::..|.:   
ADAT3_MOUSE      299 ARIQRVFYGAPSPDGAL-----GTLFRVHARPDLNHRFQVFRGILEDQCR    343

GUAD_BACSU       140 HLSPFQAWRNFANKKEY    156
                     .|.|..           
ADAT3_MOUSE      344 QLDPDP-----------    349


#---------------------------------------
и вес выранивания 75.5.

Для построения частичного выравнивания последовательностей белка GUAD_BACSU и родственного ему белка ADAT3_MOUSE выполним команду:
water sw:guad_bacsu sw:adat3_mouse bigalignment.water -auto
Программа выдаст нам файл bigalignment.water, в котором можно увидеть полученное частичное выравнивание:
#=======================================

GUAD_BACSU         4 ETFLKRAVTLACEGVNAGIGGPFGAVIVKDGA--IIAEGQNNVTTSNDPT     51
                     :|.::|||..|......|:.. .|||:|...:  ::|.| ::.::...|.
ADAT3_MOUSE      174 QTHMERAVCAAQRAAAQGLRA-VGAVVVDPASDRVLATG-HDCSSVASPL    221

GUAD_BACSU        52 AHAEVTAI----------------RKACKVLGA-----------YQLDD-     73
                     .||.:..|                ..||....|           .:||: 
ADAT3_MOUSE      222 LHAVMVCIDLVAQGQGRGSCDLRSHPACSFTQATATQGARAGSVRKLDED    271

GUAD_BACSU        74 -----CI---LYTSCEPCPMCLGAIYWARPKAVFYAAEHTDAA    108
                          |.   ||.:.|||.||..|:..||.:.|||.|...|.|
ADAT3_MOUSE      272 SLPYVCTGYDLYVTREPCVMCAMALVHARIQRVFYGAPSPDGA    314


#---------------------------------------
и вес выранивания 95.5.