Глобальное и локальное выравнивание белковых последовательностей.
Работа с программами needle, water, matcher пакета EMBOSS.
- Часть 1.Матрица переходов.
а)Глобальное выравнивание.
- Последовательности, для которых строилась матрица переходов: LQRRD, QRR.
- Параметры, использовавшиеся при построении матрицы:цена совпадения 2, цена за делецию -2, цена за замену -1.
- Изображение матрицы переходов глобального выравнивания.

- Выравнивание, соответствующие оптимальному пути:
LQRRD
- QRR -
- Вес оптимального пути:2.
б)Локальное выравнивание.
- Последовательности, для которых строилась матрица переходов: MITDSLAVV, ITAVV.
- Параметры, использовавшиеся при построении матрицы:цена совпадения 2, цена за делецию -2, цена за замену -1.
- Изображение матрицы переходов локального выравнивания.
- Выравнивание, соответствующие оптимальному пути:
MITDSLAVV
IT AVV
- Вес оптимального пути:6, субоптимального пути 4.
- Часть 2.Поиск участков локальной гомологии
- Последовательности, для которых построено локальное выравнивание при помощи программы matcher
1)BGAL_ECOLI: TMITDSLAVVLQRRDWENPGVTQLNRLAAHPPFASWRNSEEARTDRPSQQLRSLNGEWRF
AWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAPIYTNVTYPITVNPPFVPTENPT
GCYSLTFNVDESWLQEGQTRIIFDGVNSAFHLWCNGRWVGYGQDSRLPSEFDLSAFLRAG
ENRLAVMVLRWSDGSYLEDQDMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVL
EAEVQMCGELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKL
WSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKPLLIRGVNRHEHH
PLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLWYTLCDRYGLYVVDEANIETHGM
VPMNRLTDDPRWLPAMSERVTRMVQRDRNHPSVIIWSLGNESGHGANHDALYRWIKSVDP
SRPVQYEGGGADTTATDIICPMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAH
AMGNSLGGFAKYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPNDRQ
FCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSDNELLHWMVALDG
KPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTVRVVQPNATAWSEAGHISAWQQW
RLAENLSVTLPAASHAIPHLTTSEMDFCIELGNKRWQFNRQSGFLSQMWIGDKKQLLTPL
RDQFTRAPLDNDIGVSEATRIDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAH
AWQHQGKTLFISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWLGL
GPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGPHQWRGDFQFNIS
RYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDSWSPSVSAEFQLSAGRYHYQLVW
CQK
2)Последовательность из файла file3.txt(искусственно созданная последовательность,
которая состоит из двух коротких участков последовательности моего белка):
SLAVVLQRRDEFQLSAGRYH
- Координаты двух участков, из которых была построена вторая последовательность
- последовательность из файла file3.txt: 1)6-15,
2)1006-1015(все абсолютно совпадающие).
- Локальное выравнивание.
10
BGAL_E SLAVVLQRRD
::::::::::
seq3 SLAVVLQRRD
10
1010
BGAL_E EFQLSAGRYH
::::::::::
seq3 EFQLSAGRYH
20
- Часть 3.
Влияние параметров на глобальное выравнивание
- Параметры, при которых выравнивания были построены:
Матрица замены: a)BLOSUM62 b)BLOSUM62
Штраф за открытие гэпа: а)10 b)1
Штраф за продолжение гэпа: а)1 b)1
- выравнивание а)needle_62_10_1
BGAL_ECOLI 1 TMITDSLAVVLQRRDWENPGVTQLNRLAAHPPFASWRNSEEARTDRPSQQ 50
seq3 1 0
BGAL_ECOLI 51 LRSLNGEWRFAWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAPIY 100
seq3 1 0
BGAL_ECOLI 101 TNVTYPITVNPPFVPTENPTGCYSLTFNVDESWLQEGQTRIIFDGVNSAF 150
seq3 1 0
BGAL_ECOLI 151 HLWCNGRWVGYGQDSRLPSEFDLSAFLRAGENRLAVMVLRWSDGSYLEDQ 200
seq3 1 0
BGAL_ECOLI 201 DMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVLEAEVQMCGEL 250
seq3 1 0
BGAL_ECOLI 251 RDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENPKL 300
seq3 1 0
BGAL_ECOLI 301 WSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKPLL 350
seq3 1 0
BGAL_ECOLI 351 IRGVNRHEHHPLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLWYT 400
seq3 1 0
BGAL_ECOLI 401 LCDRYGLYVVDEANIETHGMVPMNRLTDDPRWLPAMSERVTRMVQRDRNH 450
seq3 1 0
BGAL_ECOLI 451 PSVIIWSLGNESGHGANHDALYRWIKSVDPSRPVQYEGGGADTTATDIIC 500
seq3 1 0
BGAL_ECOLI 501 PMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAHAMGNSLGGFA 550
seq3 1 0
BGAL_ECOLI 551 KYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPNDRQ 600
seq3 1 0
BGAL_ECOLI 601 FCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSDNE 650
seq3 1 0
BGAL_ECOLI 651 LLHWMVALDGKPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTVRV 700
seq3 1 0
BGAL_ECOLI 701 VQPNATAWSEAGHISAWQQWRLAENLSVTLPAASHAIPHLTTSEMDFCIE 750
seq3 1 0
BGAL_ECOLI 751 LGNKRWQFNRQSGFLSQMWIGDKKQLLTPLRDQFTRAPLDNDIGVSEATR 800
seq3 1 0
BGAL_ECOLI 801 IDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAHAWQHQGKTLF 850
seq3 1 0
BGAL_ECOLI 851 ISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWLGL 900
seq3 1 0
BGAL_ECOLI 901 GPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGPHQ 950
seq3 1 0
BGAL_ECOLI 951 WRGDFQFNISRYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDSWS 1000
seq3 1 0
BGAL_ECOLI 1001 PSVSA------EFQLSAGRYHYQLVWCQK 1023
|::. ||||||||||
seq3 1 SLAVVLQRRDEFQLSAGRYH 20
- выравнивание b)needle_62_1_1
BGAL_ECOLI 1 TMITDSLAVVLQRRDWENPGVTQLNRLAA--HPPFASWRNSEEARTDRPS 48
|||||||||| | . ||: |. |
seq3 1 SLAVVLQRRD-E---F-QLS--AGRYH 20
BGAL_ECOLI 49 QQLRSLNGEWRFAWFPAPEAVPESWLECDLPEADTVVVPSNWQMHGYDAP 98
seq3 21 20
BGAL_ECOLI 99 IYTNVTYPITVNPPFVPTENPTGCYSLTFNVDESWLQEGQTRIIFDGVNS 148
seq3 21 20
BGAL_ECOLI 149 AFHLWCNGRWVGYGQDSRLPSEFDLSAFLRAGENRLAVMVLRWSDGSYLE 198
seq3 21 20
BGAL_ECOLI 199 DQDMWRMSGIFRDVSLLHKPTTQISDFHVATRFNDDFSRAVLEAEVQMCG 248
seq3 21 20
BGAL_ECOLI 249 ELRDYLRVTVSLWQGETQVASGTAPFGGEIIDERGGYADRVTLRLNVENP 298
seq3 21 20
BGAL_ECOLI 299 KLWSAEIPNLYRAVVELHTADGTLIEAEACDVGFREVRIENGLLLLNGKP 348
seq3 21 20
BGAL_ECOLI 349 LLIRGVNRHEHHPLHGQVMDEQTMVQDILLMKQNNFNAVRCSHYPNHPLW 398
seq3 21 20
BGAL_ECOLI 399 YTLCDRYGLYVVDEANIETHGMVPMNRLTDDPRWLPAMSERVTRMVQRDR 448
seq3 21 20
BGAL_ECOLI 449 NHPSVIIWSLGNESGHGANHDALYRWIKSVDPSRPVQYEGGGADTTATDI 498
seq3 21 20
BGAL_ECOLI 499 ICPMYARVDEDQPFPAVPKWSIKKWLSLPGETRPLILCEYAHAMGNSLGG 548
seq3 21 20
BGAL_ECOLI 549 FAKYWQAFRQYPRLQGGFVWDWVDQSLIKYDENGNPWSAYGGDFGDTPND 598
seq3 21 20
BGAL_ECOLI 599 RQFCMNGLVFADRTPHPALTEAKHQQQFFQFRLSGQTIEVTSEYLFRHSD 648
seq3 21 20
BGAL_ECOLI 649 NELLHWMVALDGKPLASGEVPLDVAPQGKQLIELPELPQPESAGQLWLTV 698
seq3 21 20
BGAL_ECOLI 699 RVVQPNATAWSEAGHISAWQQWRLAENLSVTLPAASHAIPHLTTSEMDFC 748
seq3 21 20
BGAL_ECOLI 749 IELGNKRWQFNRQSGFLSQMWIGDKKQLLTPLRDQFTRAPLDNDIGVSEA 798
seq3 21 20
BGAL_ECOLI 799 TRIDPNAWVERWKAAGHYQAEAALLQCTADTLADAVLITTAHAWQHQGKT 848
seq3 21 20
BGAL_ECOLI 849 LFISRKTYRIDGSGQMAITVDVEVASDTPHPARIGLNCQLAQVAERVNWL 898
seq3 21 20
BGAL_ECOLI 899 GLGPQENYPDRLTAACFDRWDLPLSDMYTPYVFPSENGLRCGTRELNYGP 948
seq3 21 20
BGAL_ECOLI 949 HQWRGDFQFNISRYSQQQLMETSHRHLLHAEEGTWLNIDGFHMGIGGDDS 998
seq3 21 20
BGAL_ECOLI 999 WSPSVSAEFQLSAGRYHYQLVWCQK 1023
seq3 21 20
- Cуть отличий и как это связано с соответствующими параметрами:
Во-первых, построенные выравнивания отличаются "участками моего белка",
на котором построено глобальное выравнивание с последовательностью из файла
file3.txt.При этом в первом выравнивании были найдены именно те фрагменты
из которых была составлена последовательность из file3.txt.
Это объяснить можно тем, что штраф за открытие гэпа в первом выравнивании стоит
большой, следовательно гэпы скомпонованы вместе, при этом меньше замен и больше 100%
совпадений. При этом в первом выравнивании 100% совпадения находятся во второй половине фрагмента
выравнивания. а во втором 100% совпадения- в первой половине фрагмента, причём гэпы
"рассредоточены".
НА ГЛАВНУЮ