Пакет EMBOSS

Программы парного выравнивания


Подсчёт веса выравнивания

Используя матрицу сходства BLOSUM62, найдем вес выравнивания, полученного в прошлом занятии. Штраф за открытие гэпа - 12, за продолжение - 2.

A C R K L I T Y A F E E - - L E L N R V A I C A
P V A - C I D Y A F E S D G L E L T R L E I C -
-1 -1 -1 -12 -1 4 -1 7 4 6 5 0 -12 -2 4 5 4 0 5 1 -1 4 9 -12

Суммарный вес - 14


Построение выравнивания с помощью программы stretcher

Выполнив соответствующую команду (seq1.fasta seq2.fasta strtchraligment.stretcher -auto), я получил файл strtchraligment.stretcher. Как видно из этого файла, выравнивание вручную полностью совпадает с выравниванием, построенным stretcher. И, соответственно, веса тоже совпадают: 14
#=======================================
#
# Aligned_sequences: 2
# 1: seq1
# 2: seq2
# Matrix: EBLOSUM62
# Gap_penalty: 12
# Extend_penalty: 2
#
# Length: 24
# Identity:      11/24 (45.8%)
# Similarity:    12/24 (50.0%)
# Gaps:           4/24 (16.7%)
# Score: 14
#
#
#=======================================

               10          20
  seq1 ACRKLITYAFEE--LELNRVAICA
            : ::::   ::: :. ::
  seq2 PVA-CIDYAFESDGLELTRLEIC-
                10        20


#---------------------------------------

Построение выравниваний с помощью программ needle и water

Для построения полного выравнивания последовательностей белка и гомолога с параметрами по умолчанию выполним следующую команду:

needle sw:p96579 sw:p15808 ndlalignment.needle -auto
#=======================================
#
# Aligned_sequences: 2
# 1: YDAF_BACSU
# 2: THY1_DICDI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 355
# Identity:      47/355 (13.2%)
# Similarity:    70/355 (19.7%)
# Gaps:         224/355 (63.1%)
# Score: 58.0
#
#
#=======================================

YDAF_BACSU         0 --------------------------------------------------      0

THY1_DICDI         1 MGLDIQTEIDKIVIEKVKPEVEYYDVMGGSHRWEVKVHDHGKVALVDTMP     50

YDAF_BACSU         0 --------------------------------------------------      0

THY1_DICDI        51 RLAPVGQTADFSICQAARVSYGAGTKKVTEDKGLIRYLYRHQHTSPFEMV    100

YDAF_BACSU         1 ------------------MFTCKVNE-------------HITI-------     12
                                       ..|..|||             |.:|
THY1_DICDI       101 EFKFHCVMPVFIARQWIRHRTANVNEYSARYSVLPDKFYHPSIEEVRKQS    150

YDAF_BACSU        13 --------RLLEPKDAERLAELIIQNQQRLGKWLFFAENPSSADTYRETI     54
                             ..||||.|:...:.:.:.::             :..||.|.
THY1_DICDI       151 TSNRQGGEEALEPKTAQEFLDYLDKVEE-------------NYKTYNEL-    186

YDAF_BACSU        55 IPDWRRQYADLNGIEAGLLYDGSLCGM-----------ISLHNL------     87
                                  :|.||..:....|:           |.||||
THY1_DICDI       187 -------------LEKGLSRELGRIGLPVSIYTEWYWKIDLHNLFHFLRL    223

YDAF_BACSU        88 --DQVNRKAEIGYWIAKEFEG------KGIITAACRKLITYAFEELELNR    129
                       |..::| ||     :::..      :.|:..||...|.||||.|:|.|
THY1_DICDI       224 RMDSHSQK-EI-----RDYANTIFALIRPIVPVACEAFIDYAFESLKLTR    267

YDAF_BACSU       130 VAICA-AVGNEKSRAVPERIGFLEEGKARDGLYVNGMHHDLVYYSLLKRE    178
                     :.|.| ..|:..:......|...||.|..  |:.|...
THY1_DICDI       268 LEIEAIRTGSPLNTTNKREIEEFEEKKKL--LFPNTQA------------    303

YDAF_BACSU       179 WEGEK    183

THY1_DICDI       303 -----    303


#---------------------------------------
#---------------------------------------

Для построения частичного выравнивания нам понадобится использовать программу water. Выполним команду:
water sw:96579 sw:p15808 wtralignment.water -auto
#=======================================
#
# Aligned_sequences: 2
# 1: YDAF_BACSU
# 2: THY1_DICDI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 167
# Identity:      39/167 (23.4%)
# Similarity:    60/167 (35.9%)
# Gaps:          59/167 (35.3%)
# Score: 73.5
#
#
#=======================================

YDAF_BACSU        15 LEPKDAERLAELIIQNQQRLGKWLFFAENPSSADTYRETIIPDWRRQYAD     64
                     ||||.|:...:.:.:.::             :..||.|.
THY1_DICDI       161 LEPKTAQEFLDYLDKVEE-------------NYKTYNEL-----------    186

YDAF_BACSU        65 LNGIEAGLLYDGSLCGM-----------ISLHNL--------DQVNRKAE     95
                        :|.||..:....|:           |.||||        |..::| |
THY1_DICDI       187 ---LEKGLSRELGRIGLPVSIYTEWYWKIDLHNLFHFLRLRMDSHSQK-E    232

YDAF_BACSU        96 IGYWIAKEFEG------KGIITAACRKLITYAFEELELNRVAICA-AVGN    138
                     |     :::..      :.|:..||...|.||||.|:|.|:.|.| ..|:
THY1_DICDI       233 I-----RDYANTIFALIRPIVPVACEAFIDYAFESLKLTRLEIEAIRTGS    277

YDAF_BACSU       139 EKSRAVPERIGFLEEGK    155
                     ..:......|...||.|
THY1_DICDI       278 PLNTTNKREIEEFEEKK    294


#---------------------------------------
В частное выравнивание вошли участки 15-155 и 161-294
В результате сравнения обнаружили, что одинаковые колонки выравниваний совпадают
Вес частичного выравнивания (73.5) больше веса полного (58.0), что предсказуемо, так как в полное выравнивание выходят огромный участок с гэпами в начале и меньший участок в конце, которых не могут скомпенсировать короткие выровненные участки.