Выравнивание последовательностей
Главная
Обязательные задания
1. Посчитать вес выравнивания
Нужно посчитать вес выравнивания, полученного в упр.1 предыдущего занятия, используя матрицу BLOSUM62, штраф за открытие пробела 12 и штраф за удлинение пробела 2
|
sequence 1 |
L |
S |
K |
L |
F |
V |
P |
F |
M |
K |
- |
L |
S |
N |
N |
G |
H |
A |
E |
V |
L |
sequence 2 |
- |
A |
E |
L |
S |
V |
P |
F |
M |
K |
F |
L |
S |
N |
N |
G |
H |
A |
E |
M |
L |
Вес |
-12 |
1 |
1 |
4 |
-2 |
4 |
7 |
6 |
5 |
5 |
-12 |
4 |
4 |
6 |
6 |
6 |
8 |
4 |
5 |
1 |
4 |
Суммируя, получила общий вес 55.
2.Создание программой stretcher оптимального выравнивание тех же последовательностей
Использовала программу:
stretcher seq1.fasta seq2.fasta stretcheralignment.stretcher -auto
#=======================================
#
# Aligned_sequences: 2
# 1: seq1
# 2: seq2
# Matrix: EBLOSUM62
# Gap_penalty: 12
# Extend_penalty: 2
#
# Length: 21
# Identity: 15/21 (71.4%)
# Similarity: 18/21 (85.7%)
# Gaps: 2/21 ( 9.5%)
# Score: 55
#
#
#=======================================
10 20
seq1 LSKLFVPFMK-LSNNGHAEVL
..: ::::: ::::::::.:
seq2 -AELSVPFMKFLSNNGHAEML
10 20
#---------------------------------------
#---------------------------------------
stretcheralignment.stretcher
Полученное выравнивание полностью совпадает с моим.
3.Создание программами needle и water полного и частичного выравнивания последовательностей моего белка DAC_BACSU(P39844) и родственного белка DAC_ACTSP(P39045)
Программы needle выдаeт оптимальное полное выравнивание.
Для этого использовала команду:
needle sw:p39844 sw:p39045 needlealignment.needle -auto
DACC_BACSU 1 --------------------MKKSIKLYVAVLLLFVVASVPYMHQAALAA 30
.:.:..:.:.:|.:.::.:.|.:..|:.|
DAC_ACTSP 1 MKQSSPEPLRPRRTGGRGGARRAAALVTIPLLPMTLLGASPALADASGA- 49
DACC_BACSU 31 EKQDALSGQIDKILADHPALEGAMAGITVRSAETGAVLYEHSGDTRMRPA 80
:...|...||.||.| ||||||::|:.|....||..||...|..::.||
DAC_ACTSP 50 -RLTELREDIDAILED-PALEGAVSGVVVVDTATGEELYSRDGGEQLLPA 97
DACC_BACSU 81 SSLKLLTAAAALSVLGENYSFTTEVRTDGTLKGKKLNGNLYLKGKGDPTL 130
|::||.||||||.|||.::||.|||..:.....:....:|||.|:|||||
DAC_ACTSP 98 SNMKLFTAAAALEVLGADHSFGTEVAAESAPGRRGEVQDLYLVGRGDPTL 147
DACC_BACSU 131 LPSDFDKMAEILKHSGVKVIKGNLIGDDTWHDDMRLSPDMPWSDEYTY-Y 179
...|.|.||..:..|||:.::|:|..||||.|..||..|. |.::..| |
DAC_ACTSP 148 SAEDLDAMAAEVAASGVRTVRGDLYADDTWFDSERLVDDW-WPEDEPYAY 196
DACC_BACSU 180 GAPISALTASPNEDYDAGTVIVEVTPNQKEGEEPAVSVSPKTDYITIKND 229
.|.|||||.:..|.:|.|...|.||| ..|||...|.:.....|..:.|.
DAC_ACTSP 197 SAQISALTVAHGERFDTGVTEVSVTP-AAEGEPADVDLGAAEGYAELDNR 245
DACC_BACSU 230 AKTTAAGSEKDLTIEREHGTNTITIEGSVPVDANKTKEWISVWEPAGYAL 279
|.|.||||...|.|:|..|||||.:.||:|.||.......:|.|||..|.
DAC_ACTSP 246 AVTGAAGSANTLVIDRPVGTNTIAVTGSLPADAAPVTALRTVDEPAALAG 295
DACC_BACSU 280 DLFKQSLKKQGITVKGDIKTGEAPS---SSDVLLSHRSMPLSKLFVPFMK 326
.||:::|:..|:|||||:..|..|: .::||..|.|..||::.|||||
DAC_ACTSP 296 HLFEEALESNGVTVKGDVGLGGVPADWQDAEVLADHTSAELSEILVPFMK 345
DACC_BACSU 327 LSNNGHAEVLVKEMGKVKKGEGSWEKGLEVLNSTLPEFGVDSKSLVLRDG 376
.|||||||:|||.:|:...|.|:|:.||..:...|...|||:..|||.||
DAC_ACTSP 346 FSNNGHAEMLVKSIGQETAGAGTWDAGLVGVEEALSGLGVDTAGLVLNDG 395
DACC_BACSU 377 SGISHIDAVSSDQLSQLLYDIQDQSWFSAYLNSLPVAGNPDRMVGGTLRN 426
||:|..:.|::|.:..||.......|...:..||||||..|..|||||.|
DAC_ACTSP 396 SGLSRGNLVTADTVVDLLGQAGSAPWAQTWSASLPVAGESDPFVGGTLAN 445
DACC_BACSU 427 RMKGTPAQGKVRAKTGSLSTVSSLSGYAETKSGKKLVFSILLNGLIDEED 476
||:||.|:|.|.||||::|.||:||||.....| :|.|||:.|| ..
DAC_ACTSP 446 RMRGTAAEGVVEAKTGTMSGVSALSGYVPGPEG-ELAFSIVNNG----HS 490
DACC_BACSU 477 GK---DIEDQIAVILANQ------------------------------ 491
|. .::|.|||.||..
DAC_ACTSP 491 GPAPLAVQDAIAVRLAEYAGHQAPEGARMMRGPVQGSGELECSWVQAC 538
needlealignment.needle
Программа water выполняет оптимальное частичное выравнивание.
Для этого применяла команду:
water sw:p39844 sw:p39045 wateralignment.water -auto
DACC_BACSU 9 VAVLLLFVVASVPYMHQAALAAEKQDALSGQIDKILADHPALEGAMAGIT 58
:.:|.:.::.:.|.:..|:.| :...|...||.||.| ||||||::|:.
DAC_ACTSP 29 IPLLPMTLLGASPALADASGA--RLTELREDIDAILED-PALEGAVSGVV 75
DACC_BACSU 59 VRSAETGAVLYEHSGDTRMRPASSLKLLTAAAALSVLGENYSFTTEVRTD 108
|....||..||...|..::.|||::||.||||||.|||.::||.|||..:
DAC_ACTSP 76 VVDTATGEELYSRDGGEQLLPASNMKLFTAAAALEVLGADHSFGTEVAAE 125
DACC_BACSU 109 GTLKGKKLNGNLYLKGKGDPTLLPSDFDKMAEILKHSGVKVIKGNLIGDD 158
.....:....:|||.|:|||||...|.|.||..:..|||:.::|:|..||
DAC_ACTSP 126 SAPGRRGEVQDLYLVGRGDPTLSAEDLDAMAAEVAASGVRTVRGDLYADD 175
DACC_BACSU 159 TWHDDMRLSPDMPWSDEYTY-YGAPISALTASPNEDYDAGTVIVEVTPNQ 207
||.|..||..|. |.::..| |.|.|||||.:..|.:|.|...|.||| .
DAC_ACTSP 176 TWFDSERLVDDW-WPEDEPYAYSAQISALTVAHGERFDTGVTEVSVTP-A 223
DACC_BACSU 208 KEGEEPAVSVSPKTDYITIKNDAKTTAAGSEKDLTIEREHGTNTITIEGS 257
.|||...|.:.....|..:.|.|.|.||||...|.|:|..|||||.:.||
DAC_ACTSP 224 AEGEPADVDLGAAEGYAELDNRAVTGAAGSANTLVIDRPVGTNTIAVTGS 273
DACC_BACSU 258 VPVDANKTKEWISVWEPAGYALDLFKQSLKKQGITVKGDIKTGEAPS--- 304
:|.||.......:|.|||..|..||:::|:..|:|||||:..|..|:
DAC_ACTSP 274 LPADAAPVTALRTVDEPAALAGHLFEEALESNGVTVKGDVGLGGVPADWQ 323
DACC_BACSU 305 SSDVLLSHRSMPLSKLFVPFMKLSNNGHAEVLVKEMGKVKKGEGSWEKGL 354
.::||..|.|..||::.|||||.|||||||:|||.:|:...|.|:|:.||
DAC_ACTSP 324 DAEVLADHTSAELSEILVPFMKFSNNGHAEMLVKSIGQETAGAGTWDAGL 373
DACC_BACSU 355 EVLNSTLPEFGVDSKSLVLRDGSGISHIDAVSSDQLSQLLYDIQDQSWFS 404
..:...|...|||:..|||.||||:|..:.|::|.:..||.......|..
DAC_ACTSP 374 VGVEEALSGLGVDTAGLVLNDGSGLSRGNLVTADTVVDLLGQAGSAPWAQ 423
DACC_BACSU 405 AYLNSLPVAGNPDRMVGGTLRNRMKGTPAQGKVRAKTGSLSTVSSLSGYA 454
.:..||||||..|..|||||.|||:||.|:|.|.||||::|.||:||||.
DAC_ACTSP 424 TWSASLPVAGESDPFVGGTLANRMRGTAAEGVVEAKTGTMSGVSALSGYV 473
DACC_BACSU 455 ETKSGKKLVFSILLNGLIDEEDGK---DIEDQIAVILA 489
....| :|.|||:.|| ..|. .::|.|||.||
DAC_ACTSP 474 PGPEG-ELAFSIVNNG----HSGPAPLAVQDAIAVRLA 506
wateralignment.water
В частичное выравнивание вошел участок последовательности 9-506.
Локальное выравнивание совпадает с "ограничением" глобального на этот участок.
У локального выравнивания вес 908 ,что больше, чем у глобального(904).
Вес оптимального глобального выравнивания не может быть больше веса оптимального локального выравнивания из-за наличия в первом невыгодных с точки зрения наибольшего веса выравнивания участков.
©Eliseeva Julia