1.
Подсчет веса выравнивания
Первая строка выравнивания
| -
| -
| I
| N
| -
| H
| D
| G
| K
| L
| D
| Q
| A
| F
| A
| L
| I
| D
| A
| A
| A
| E
| A
| G
|
Вторая строка выравнивания
| G
| R
| I
| N
| F
| H
| D
| G
| K
| L
| G
| -
| -
| -
| -
| L
| I
| D
| M
| M
| A
| E
| A
| A
|
Веса позиций выравнивания
| -12
| -2
| 4
| 6
| -12
| 8
| 6
| 6
| 5
| 4
| -1
| -12
| -2
| -2
| -2
| 4
| 4
| 6
| -1
| -1
| 4
| 5
| 4
| 0
|
Вес выравнивания -
19
В EMBOSS есть четыре программы, выдающие парное выравнивание:
needle - оптимальное полное выравнивание
water - оптимальное частичное выравнивание
stretcher - оптимальное полное выравнивание
matcher - несколько (по умолчанию три) частичных выравниваний с наибольшим весом.
2. Построение выравнивания с помощью программы stretcher.
Создадим программой stretcher оптимальное выравнивание тех же последовательностей seq1 и seq2
(по умолчанию программа stretcher использует те же параметры: матрица BLOSUM62, штрафы 12 и 2). Для этого используем следущую команду:
stretcher seq1.fasta seq2.fasta alignment.stretcher -auto
Получен файл
alignment.stretcher, в конце которого - выравнивание,
построенное программой stretcher :
########################################
# Program: stretcher
# Rundate: Thu 29 Mar 2012 22:33:19
# Commandline: stretcher
# [-asequence] seq1.fasta
# [-bsequence] seq2.fasta
# [-outfile] alignment.stretcher
# -auto
# Align_format: markx0
# Report_file: alignment.stretcher
########################################
#=======================================
#
# Aligned_sequences: 2
# 1:
# 2:
# Matrix: EBLOSUM62
# Gap_penalty: 12
# Extend_penalty: 2
#
# Length: 24
# Identity: 13/24 (54.2%)
# Similarity: 13/24 (54.2%)
# Gaps: 7/24 (29.2%)
# Score: 20
#
#
#=======================================
10 20
--IN-HDGKLDQAFALIDAAAEAG
:: ::::: ::: :::
GRINFHDGKL----GLIDMMAEAA
10 20
#---------------------------------------
#---------------------------------------
Вес выравнивания, построенного программой -
20 (лучше, чем мое выравнивание)
3. Построение выравниваний с помощью программ needle и water.
Для построения
полного выравнивания последовательностей белка
SPSE_BACSU и родственного ему белка SIAS_HUMAN выполним команду:
needle sw:spse_bacsu sw:sias_human bigalignment.needle -auto
Программа выдаст нам файл
alignmentneedle.txt, в котором можно увидеть
полученное полное выравнивание:
#=======================================
SPSE_BACSU 1 --MAAFQIANKTVGKDAPVFIIAEAGINHDGKLDQAFALIDAAAEAGADA 48
:.......:.||...|.|||||.|.||.|.||.|..:|..|.|.|||.
SIAS_HUMAN 1 MPLELELCPGRWVGGQHPCFIIAEIGQNHQGDLDVAKRMIRMAKECGADC 50
SPSE_BACSU 49 VKFQM----FQADRMYQKDPGLYKTAAGKDVSIFSLVQSMEMPAEWILPL 94
.|||. |:.:|...:.|...|.:.||...... :.:|...:....|
SIAS_HUMAN 51 AKFQKSELEFKFNRKALERPYTSKHSWGKTYGEHK--RHLEFSHDQYREL 98
SPSE_BACSU 95 LDYCREKQVIFLSTVCDEGSADLLQSTSPSAFKIASYEINHLPLLKYVAR 144
..|..|..:.|.::..||.:.:.|...:...||:.|.:.|:.|.|:..|:
SIAS_HUMAN 99 QRYAEEVGIFFTASGMDEMAVEFLHELNVPFFKVGSGDTNNFPYLEKTAK 148
SPSE_BACSU 145 LNRPMIFSTAGAEISDVHEAWRTIRAEGNNQIAIMHCVAKYPAPPEYSNL 194
..|||:.|:....:..:.:.::.::.. |.....:.|.:.||..||..||
SIAS_HUMAN 149 KGRPMVISSGMQSMDTMKQVYQIVKPL-NPNFCFLQCTSAYPLQPEDVNL 197
SPSE_BACSU 195 SVIPMLAAAFPEAVIGFSDHSEHPTEAPCAAVRLGAKLIEKHFTIDKNLP 244
.||......||:..||:|.| |.......|||.||||::|:|.|:||...
SIAS_HUMAN 198 RVISEYQKLFPDIPIGYSGH-ETGIAISVAAVALGAKVLERHITLDKTWK 246
SPSE_BACSU 245 GADHSFALNPDELKEMVDGIRKTEAELKQGITKPVSEKLLGSSYKTTTAI 294
|:|||.:|.|.||.|:|..:| :.|:.|||..|.....
SIAS_HUMAN 247 GSDHSASLEPGELAELVRSVR-------------LVERALGSPTKQLLPC 283
SPSE_BACSU 295 EGEIRNFAYRGIFTTAPIQKGEAFSEDNIAVLRPGQKPQGLHPR-FFELL 343
|........:.:.....|.:|...:.|.:.| :.|: |:|..|. .|.|:
SIAS_HUMAN 284 EMACNEKLGKSVVAKVKIPEGTILTMDMLTV-KVGE-PKGYPPEDIFNLV 331
SPSE_BACSU 344 TSGVRAVRDIPADTGIVWDDILLKDSPFHE------ 373
...|... :..||.::::...:.
SIAS_HUMAN 332 GKKVLVT--------VEEDDTIMEELVDNHGKKIKS 359
#---------------------------------------
#---------------------------------------
Вес выравнивания 346
Для построения
частичного выравнивания последовательностей белка
SPSE_BACSU и родственного ему белка SIAS_HUMAN выполним команду:
water sw:spse_bacsu sw:sias_human bigalignment.water -auto
Программа выдаст нам файл
bigalignmentwater.txt, в котором можно увидеть
полученное частичное выравнивание:
=======================================
SPSE_BACSU 11 VGKDAPVFIIAEAGINHDGKLDQAFALIDAAAEAGADAVKFQM----FQA 56
||...|.|||||.|.||.|.||.|..:|..|.|.|||..|||. |:.
SIAS_HUMAN 13 VGGQHPCFIIAEIGQNHQGDLDVAKRMIRMAKECGADCAKFQKSELEFKF 62
SPSE_BACSU 57 DRMYQKDPGLYKTAAGKDVSIFSLVQSMEMPAEWILPLLDYCREKQVIFL 106
:|...:.|...|.:.||...... :.:|...:....|..|..|..:.|.
SIAS_HUMAN 63 NRKALERPYTSKHSWGKTYGEHK--RHLEFSHDQYRELQRYAEEVGIFFT 110
SPSE_BACSU 107 STVCDEGSADLLQSTSPSAFKIASYEINHLPLLKYVARLNRPMIFSTAGA 156
::..||.:.:.|...:...||:.|.:.|:.|.|:..|:..|||:.|:...
SIAS_HUMAN 111 ASGMDEMAVEFLHELNVPFFKVGSGDTNNFPYLEKTAKKGRPMVISSGMQ 160
SPSE_BACSU 157 EISDVHEAWRTIRAEGNNQIAIMHCVAKYPAPPEYSNLSVIPMLAAAFPE 206
.:..:.:.::.::.. |.....:.|.:.||..||..||.||......||:
SIAS_HUMAN 161 SMDTMKQVYQIVKPL-NPNFCFLQCTSAYPLQPEDVNLRVISEYQKLFPD 209
SPSE_BACSU 207 AVIGFSDHSEHPTEAPCAAVRLGAKLIEKHFTIDKNLPGADHSFALNPDE 256
..||:|.| |.......|||.||||::|:|.|:||...|:|||.:|.|.|
SIAS_HUMAN 210 IPIGYSGH-ETGIAISVAAVALGAKVLERHITLDKTWKGSDHSASLEPGE 258
SPSE_BACSU 257 LKEMVDGIRKTEAELKQGITKPVSEKLLGSSYKTTTAIEGEIRNFAYRGI 306
|.|:|..:| :.|:.|||..|.....|........:.:
SIAS_HUMAN 259 LAELVRSVR-------------LVERALGSPTKQLLPCEMACNEKLGKSV 295
SPSE_BACSU 307 FTTAPIQKGEAFSEDNIAVLRPGQKPQGLHP 337
.....|.:|...:.|.:.| :.|: |:|..|
SIAS_HUMAN 296 VAKVKIPEGTILTMDMLTV-KVGE-PKGYPP 324
#---------------------------------------
#---------------------------------------
Вес выравнивания 363
В частичное выравнивание вошёл участок последовательности моего белка от 11 до 337 а/о и родственного ему от 13 до 324 а/о.
Локальное выравнивание совпадает с "ограничением" глобального на этот участок.
Больший вес имеет локальное выравнивание (363 у локального и 346 у глобального).
Вес оптимального глобального выравнивания не может быть больше веса оптимального локального выравнивая, тк в глобальном выравнивании гораздо больше участков, которые "минусуют" общий вес выравнивания.