Учебный сайт Фоменко Елены
Главная | Семестры | Проекты | Заметки |
1. Таблица для подсчета веса моего выравнивания из прошлого занятия:
seq1 | I | K | D | M | F | I | D | I | G | A | S | S | R | E | E | A | L | E | W | G | V | L | - | - | P | G |
seq2 | M | - | - | M | - | I | D | I | G | A | - | - | - | E | F | A | I | K | I | G | V | I | T | R | P | G |
Вес | 1 | -12 | -2 | 5 | -12 | 4 | 6 | 4 | 6 | 4 | -12 | -2 | -2 | 5 | -3 | 4 | 2 | 1 | -3 | 6 | 4 | 2 | -12 | -2 | 7 | 6 |
Вес выравнивания: 1-12-2+5-12+4+6+4+6+4-12-2-2+5-3+4+2+1-3+6+4+2-12-2+7+6=5
2. С помощью программы stretcher
командой
stretcher seq2.fasta seq1.fasta alignment.stretcher -auto
получила:
#======================================= # # Aligned_sequences: 2 # 1: YSDC_BACSU1 # 2: YSDC_BACSU2 # Matrix: EBLOSUM62 # Gap_penalty: 12 # Extend_penalty: 2 # # Length: 26 # Identity: 12/26 (46.2%) # Similarity: 15/26 (57.7%) # Gaps: 8/26 (30.8%) # Score: 14 # # #======================================= 10 20 YSDC_B IKDMFIDIGASSREEALEWGVL--PG : ::::: : :.. ::. :: YSDC_B ---MMIDIGA---EFAIKIGVITRPG 10 20
Выравнивание с моим не совпало. Т.к. я не знала о штрафе -12 при открытии пробелов, я руководствовалась, главным образом, данными таблицы BLOSUM62. В итоге вес, выданный программой, оказался на 9 больше (5+12-2-1).
3. C помощью программы needle командой
needle sw:O34924 sw:P94521 alignment1.needle -auto
получила оптимальное полное выравнивание последовательностей белков YSDC_BACSU и гомологичного ему YTOP_BACSU:
#======================================= # # Aligned_sequences: 2 # 1: YTOP_BACSU # 2: YSDC_BACSU # Matrix: EBLOSUM62 # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 362 # Identity: 171/362 (47.2%) # Similarity: 245/362 (67.7%) # Gaps: 6/362 ( 1.7%) # Score: 911.5 # # #======================================= YTOP_BACSU 1 --MNQETKALFQTLTQLPGAPGNEHQVRAFMKQELAKYADDIVQDRLGSV 48 ...||..:.:.||...|.||||.:||..||..:..:||::..|||||: YSDC_BACSU 1 MAKLDETLTMLKDLTDAKGIPGNEREVRQVMKSYIEPFADEVTTDRLGSL 50 YTOP_BACSU 49 FGVRRGAEDAPRIMVAGHMDEVGFMVTSITDNGLLRFQTLGGWWSQVLLA 98 ...:.|||:.|:||:|||:||||||||.|||.|.:||||:||||:||:|| YSDC_BACSU 51 IAKKTGAENGPKIMIAGHLDEVGFMVTQITDKGFIRFQTVGGWWAQVMLA 100 YTOP_BACSU 99 QRVEIQTDNGPVPGVISSIPPHLLTDAQRNRPMDIKNMMIDIGADDKEDA 148 |||.|.|..|.:.|||.|.|||:|:...|.:.::||:|.|||||..:|:| YSDC_BACSU 101 QRVTIVTKKGEITGVIGSKPPHILSPEARKKSVEIKDMFIDIGASSREEA 150 YTOP_BACSU 149 IKIGIRPGQQIVPVCPFTTMANEKKILSKAWDNRYGCGLSIELLKELHGK 198 ::.|:.||..|||...||.|.|||.:|:||||||.||.::|::|:.|... YSDC_BACSU 151 LEWGVLPGDMIVPHFEFTVMNNEKFLLAKAWDNRIGCAIAIDVLRNLQNT 200 YTOP_BACSU 199 ELPNTLYAGATVQEEVGLRGAQTASHMIKPDLFFALDASPANDMSG--DK 246 :.||.:|...|||||||||||:||:|.|:||:.|.:|...|.|..| :| YSDC_BACSU 201 DHPNIVYGVGTVQEEVGLRGAKTAAHTIQPDIAFGVDVGIAGDTPGISEK 250 YTOP_BACSU 247 NEFGQLGKGFLLRILDRTTVMHRGMREFVLDMAETHDIPYQY-FVSGGGT 295 ....::|||..:.:.|.:.|.|:|:|:.|:..||...||||: .::|||| YSDC_BACSU 251 EAQSKMGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFDAIAGGGT 300 YTOP_BACSU 296 DAGKVHISNSGVPSAVIGICSRYIHTNATIIHIDDYAAAKEMLIKLVTAC 345 |:|.:|::.:|||:..|.|.:|||||:|.::|.|||..|.:::.:::... YSDC_BACSU 301 DSGAIHLTANGVPALSITIATRYIHTHAAMLHRDDYENAVKLITEVIKKL 350 YTOP_BACSU 346 DKQTVDAIKENM 357 |::|||.|... YSDC_BACSU 351 DRKTVDEITYQ- 361 #--------------------------------------- #---------------------------------------
C помощью программы water командой
water sw:O34924 sw:P94521 alignment2.water -auto
получила частичное выравнивание этих последовательностей:
#======================================= # # Aligned_sequences: 2 # 1: YTOP_BACSU # 2: YSDC_BACSU # Matrix: EBLOSUM62 # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 353 # Identity: 171/353 (48.4%) # Similarity: 245/353 (69.4%) # Gaps: 3/353 ( 0.8%) # Score: 918.5 # # #======================================= YTOP_BACSU 4 ETKALFQTLTQLPGAPGNEHQVRAFMKQELAKYADDIVQDRLGSVFGVRR 53 ||..:.:.||...|.||||.:||..||..:..:||::..|||||:...:. YSDC_BACSU 6 ETLTMLKDLTDAKGIPGNEREVRQVMKSYIEPFADEVTTDRLGSLIAKKT 55 YTOP_BACSU 54 GAEDAPRIMVAGHMDEVGFMVTSITDNGLLRFQTLGGWWSQVLLAQRVEI 103 |||:.|:||:|||:||||||||.|||.|.:||||:||||:||:|||||.| YSDC_BACSU 56 GAENGPKIMIAGHLDEVGFMVTQITDKGFIRFQTVGGWWAQVMLAQRVTI 105 YTOP_BACSU 104 QTDNGPVPGVISSIPPHLLTDAQRNRPMDIKNMMIDIGADDKEDAIKIGI 153 .|..|.:.|||.|.|||:|:...|.:.::||:|.|||||..:|:|::.|: YSDC_BACSU 106 VTKKGEITGVIGSKPPHILSPEARKKSVEIKDMFIDIGASSREEALEWGV 155 YTOP_BACSU 154 RPGQQIVPVCPFTTMANEKKILSKAWDNRYGCGLSIELLKELHGKELPNT 203 .||..|||...||.|.|||.:|:||||||.||.::|::|:.|...:.||. YSDC_BACSU 156 LPGDMIVPHFEFTVMNNEKFLLAKAWDNRIGCAIAIDVLRNLQNTDHPNI 205 YTOP_BACSU 204 LYAGATVQEEVGLRGAQTASHMIKPDLFFALDASPANDMSG--DKNEFGQ 251 :|...|||||||||||:||:|.|:||:.|.:|...|.|..| :|....: YSDC_BACSU 206 VYGVGTVQEEVGLRGAKTAAHTIQPDIAFGVDVGIAGDTPGISEKEAQSK 255 YTOP_BACSU 252 LGKGFLLRILDRTTVMHRGMREFVLDMAETHDIPYQY-FVSGGGTDAGKV 300 :|||..:.:.|.:.|.|:|:|:.|:..||...||||: .::|||||:|.: YSDC_BACSU 256 MGKGPQIIVYDASMVSHKGLRDAVVATAEEAGIPYQFDAIAGGGTDSGAI 305 YTOP_BACSU 301 HISNSGVPSAVIGICSRYIHTNATIIHIDDYAAAKEMLIKLVTACDKQTV 350 |::.:|||:..|.|.:|||||:|.::|.|||..|.:::.:::...|::|| YSDC_BACSU 306 HLTANGVPALSITIATRYIHTHAAMLHRDDYENAVKLITEVIKKLDRKTV 355 YTOP_BACSU 351 DAI 353 |.| YSDC_BACSU 356 DEI 358 #--------------------------------------- #---------------------------------------
В него вошли участки последовательностей 6-358 и 4-353, соответственно для YSDC_BACSU и YTOP_BACSU.
Локальное выравнивание совпадает с "ограничением" глобального на эти участки.
Больший вес(918,5) имеет локальное выравнивание – 918,5 (против 911,5 у глобального). Думаю, вес оптимального глобального выравнивания не может быть больше веса локального, т.к. в глобальном выравнивании представлено больше соответствий, а среди них есть и те, которые довольно значительно уменьшают вес выравнивания.