Учебный сайт Фоменко Елены
| Главная | Семестры | Проекты | Заметки |
1. Таблица для подсчета веса моего выравнивания из прошлого занятия:
| seq1 | I | K | D | M | F | I | D | I | G | A | S | S | R | E | E | A | L | E | W | G | V | L | - | - | P | G |
| seq2 | M | - | - | M | - | I | D | I | G | A | - | - | - | E | F | A | I | K | I | G | V | I | T | R | P | G |
| Вес | 1 | -12 | -2 | 5 | -12 | 4 | 6 | 4 | 6 | 4 | -12 | -2 | -2 | 5 | -3 | 4 | 2 | 1 | -3 | 6 | 4 | 2 | -12 | -2 | 7 | 6 |
Вес выравнивания: 1-12-2+5-12+4+6+4+6+4-12-2-2+5-3+4+2+1-3+6+4+2-12-2+7+6=5
2. С помощью программы stretcher
командой
stretcher seq2.fasta seq1.fasta alignment.stretcher -auto
получила:
#=======================================
#
# Aligned_sequences: 2
# 1: YSDC_BACSU1
# 2: YSDC_BACSU2
# Matrix: EBLOSUM62
# Gap_penalty: 12
# Extend_penalty: 2
#
# Length: 26
# Identity: 12/26 (46.2%)
# Similarity: 15/26 (57.7%)
# Gaps: 8/26 (30.8%)
# Score: 14
#
#
#=======================================
10 20
YSDC_B IKDMFIDIGASSREEALEWGVL--PG
: ::::: : :.. ::. ::
YSDC_B ---MMIDIGA---EFAIKIGVITRPG
10 20
Выравнивание с моим не совпало. Т.к. я не знала о штрафе -12 при открытии пробелов, я руководствовалась, главным образом, данными таблицы BLOSUM62. В итоге вес, выданный программой, оказался на 9 больше (5+12-2-1).
3. C помощью программы needle командой
needle sw:O34924 sw:P94521 alignment1.needle -auto
получила оптимальное полное выравнивание последовательностей белков YSDC_BACSU и гомологичного ему YTOP_BACSU:
#=======================================
#
# Aligned_sequences: 2
# 1: YTOP_BACSU
# 2: YSDC_BACSU
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 362
# Identity: 171/362 (47.2%)
# Similarity: 245/362 (67.7%)
# Gaps: 6/362 ( 1.7%)
# Score: 911.5
#
#
#=======================================
YTOP_BACSU 1 --MNQETKALFQTLTQLPGAPGNEHQVRAFMKQELAKYADDIVQDRLGSV 48
...||..:.:.||...|.||||.:||..||..:..:||::..|||||:
YSDC_BACSU 1 MAKLDETLTMLKDLTDAKGIPGNEREVRQVMKSYIEPFADEVTTDRLGSL 50
YTOP_BACSU 49 FGVRRGAEDAPRIMVAGHMDEVGFMVTSITDNGLLRFQTLGGWWSQVLLA 98
...:.|||:.|:||:|||:||||||||.|||.|.:||||:||||:||:||
YSDC_BACSU 51 IAKKTGAENGPKIMIAGHLDEVGFMVTQITDKGFIRFQTVGGWWAQVMLA 100
YTOP_BACSU 99 QRVEIQTDNGPVPGVISSIPPHLLTDAQRNRPMDIKNMMIDIGADDKEDA 148
|||.|.|..|.:.|||.|.|||:|:...|.:.::||:|.|||||..:|:|
YSDC_BACSU 101 QRVTIVTKKGEITGVIGSKPPHILSPEARKKSVEIKDMFIDIGASSREEA 150
YTOP_BACSU 149 IKIGIRPGQQIVPVCPFTTMANEKKILSKAWDNRYGCGLSIELLKELHGK 198
::.|:.||..|||...||.|.|||.:|:||||||.||.::|::|:.|...
YSDC_BACSU 151 LEWGVLPGDMIVPHFEFTVMNNEKFLLAKAWDNRIGCAIAIDVLRNLQNT 200
YTOP_BACSU 199 ELPNTLYAGATVQEEVGLRGAQTASHMIKPDLFFALDASPANDMSG--DK 246
:.||.:|...|||||||||||:||:|.|:||:.|.:|...|.|..| :|
YSDC_BACSU 201 DHPNIVYGVGTVQEEVGLRGAKTAAHTIQPDIAFGVDVGIAGDTPGISEK 250
YTOP_BACSU 247 NEFGQLGKGFLLRILDRTTVMHRGMREFVLDMAETHDIPYQY-FVSGGGT 295
....::|||..:.:.|.:.|.|:|:|:.|:..||...||||: .::||||
YSDC_BACSU 251 EAQSKMGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFDAIAGGGT 300
YTOP_BACSU 296 DAGKVHISNSGVPSAVIGICSRYIHTNATIIHIDDYAAAKEMLIKLVTAC 345
|:|.:|::.:|||:..|.|.:|||||:|.::|.|||..|.:::.:::...
YSDC_BACSU 301 DSGAIHLTANGVPALSITIATRYIHTHAAMLHRDDYENAVKLITEVIKKL 350
YTOP_BACSU 346 DKQTVDAIKENM 357
|::|||.|...
YSDC_BACSU 351 DRKTVDEITYQ- 361
#---------------------------------------
#---------------------------------------
C помощью программы water командой
water sw:O34924 sw:P94521 alignment2.water -auto
получила частичное выравнивание этих последовательностей:
#=======================================
#
# Aligned_sequences: 2
# 1: YTOP_BACSU
# 2: YSDC_BACSU
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 353
# Identity: 171/353 (48.4%)
# Similarity: 245/353 (69.4%)
# Gaps: 3/353 ( 0.8%)
# Score: 918.5
#
#
#=======================================
YTOP_BACSU 4 ETKALFQTLTQLPGAPGNEHQVRAFMKQELAKYADDIVQDRLGSVFGVRR 53
||..:.:.||...|.||||.:||..||..:..:||::..|||||:...:.
YSDC_BACSU 6 ETLTMLKDLTDAKGIPGNEREVRQVMKSYIEPFADEVTTDRLGSLIAKKT 55
YTOP_BACSU 54 GAEDAPRIMVAGHMDEVGFMVTSITDNGLLRFQTLGGWWSQVLLAQRVEI 103
|||:.|:||:|||:||||||||.|||.|.:||||:||||:||:|||||.|
YSDC_BACSU 56 GAENGPKIMIAGHLDEVGFMVTQITDKGFIRFQTVGGWWAQVMLAQRVTI 105
YTOP_BACSU 104 QTDNGPVPGVISSIPPHLLTDAQRNRPMDIKNMMIDIGADDKEDAIKIGI 153
.|..|.:.|||.|.|||:|:...|.:.::||:|.|||||..:|:|::.|:
YSDC_BACSU 106 VTKKGEITGVIGSKPPHILSPEARKKSVEIKDMFIDIGASSREEALEWGV 155
YTOP_BACSU 154 RPGQQIVPVCPFTTMANEKKILSKAWDNRYGCGLSIELLKELHGKELPNT 203
.||..|||...||.|.|||.:|:||||||.||.::|::|:.|...:.||.
YSDC_BACSU 156 LPGDMIVPHFEFTVMNNEKFLLAKAWDNRIGCAIAIDVLRNLQNTDHPNI 205
YTOP_BACSU 204 LYAGATVQEEVGLRGAQTASHMIKPDLFFALDASPANDMSG--DKNEFGQ 251
:|...|||||||||||:||:|.|:||:.|.:|...|.|..| :|....:
YSDC_BACSU 206 VYGVGTVQEEVGLRGAKTAAHTIQPDIAFGVDVGIAGDTPGISEKEAQSK 255
YTOP_BACSU 252 LGKGFLLRILDRTTVMHRGMREFVLDMAETHDIPYQY-FVSGGGTDAGKV 300
:|||..:.:.|.:.|.|:|:|:.|:..||...||||: .::|||||:|.:
YSDC_BACSU 256 MGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFDAIAGGGTDSGAI 305
YTOP_BACSU 301 HISNSGVPSAVIGICSRYIHTNATIIHIDDYAAAKEMLIKLVTACDKQTV 350
|::.:|||:..|.|.:|||||:|.::|.|||..|.:::.:::...|::||
YSDC_BACSU 306 HLTANGVPALSITIATRYIHTHAAMLHRDDYENAVKLITEVIKKLDRKTV 355
YTOP_BACSU 351 DAI 353
|.|
YSDC_BACSU 356 DEI 358
#---------------------------------------
#---------------------------------------
В него вошли участки последовательностей 6-358 и 4-353, соответственно для YSDC_BACSU и YTOP_BACSU.
Локальное выравнивание совпадает с "ограничением" глобального на эти участки.
Больший вес(918,5) имеет локальное выравнивание – 918,5 (против 911,5 у глобального). Думаю, вес оптимального глобального выравнивания не может быть больше веса локального, т.к. в глобальном выравнивании представлено больше соответствий, а среди них есть и те, которые довольно значительно уменьшают вес выравнивания.