1. Подсчёт веса выравнивания.
Посчитаем вес выравнивания, полученного в упр.1 предыдущего занятия, используя матрицу BLOSUM62.
Штраф за открытие пробела 12 и штраф за удлинение пробела 2.
Файлы коротких последовательностей: seq1.fasta, seq2.fasta

seq1 | - | V | T | T | S | N | D | P | T | A | H | A | E | - | - | V | T | A | I | R | K | A |
seq2 | I | V | T | E | S | N | D | - | - | A | H | A | E | S | F | V | T | N | I | M | K | A |
Вес | -12 | 4 | 5 | -1 | 4 | 6 | 6 | -12 | -2 | 4 | 8 | 4 | 5 | -12 | -2 | 4 | 5 | -2 | 4 | -1 | 5 | 4 |
В EMBOSS есть четыре программы, выдающие парное выравнивание: needle, water, stretcher и matcher. Программы needle и stretcher выдают оптимальное полное выравнивание, программа water — оптимальное частичное выравнивание, программа matcher выдаёт несколько (по умолчанию три) частичных выравниваний с наибольшим весом.
2. Построение выравнивания с помощью программы stretcher.
Создадим программой stretcher оптимальное выравнивание тех же последовательностей seq1 и seq2 (NB! по умолчанию программа stretcher использует те же параметры: матрица BLOSUM62, штрафы 12 и 2). Для этого используем следущую команду:
stretcher seq1.fasta seq2.fasta alignment.stretcher -autoПрограмма выдасть нам такой файл alignment.stretcher, в конце которого мы увидим выравнивание, построенное программой stretcher :
# # Length: 20 # Identity: 10/20 (50.0%) # Similarity: 12/20 (60.0%) # Gaps: 1/20 ( 5.0%) # Score: 30 # #--------------------------------------- 10 SEQ1 VTT-SNDPTAHAEVTAIRKA . : ::: : . :: : :: SEQ2 IVTESNDAHAESFVTNIMKA 10 20 #---------------------------------------Заметим, что вес выравнивания, построенный программой 30 (в то время как мой - 24), это значит, что выранивание, построенное программой лучше.
3. Построение выравниваний с помощью программ needle и water.
Для построения полного выравнивания последовательностей белка GUAD_BACSU и родственного ему белка ADAT3_MOUSE выполним команду:
needle sw:guad_bacsu sw:adat3_mouse bigalignment.needle -autoПрограмма выдаст нам файл bigalignment.needle, в котором можно увидеть полученное полное выравнивание:
#======================================= GUAD_BACSU 0 -------------------------------------------------- 0 ADAT3_MOUSE 1 MEPTSGFAEQPGPVKAESEEQEPAQWQALPVLSEQQSGAVELILAYAAPV 50 GUAD_BACSU 0 -------------------------------------------------- 0 ADAT3_MOUSE 51 LDKRQTSRLLREVSAVYPLPAQPHLKRVRPSRSAGGAQSSDLLLCLAGPS 100 GUAD_BACSU 0 -------------------------------------------------- 0 ADAT3_MOUSE 101 AGPRSLAELLPRPAVDPRGLGTPFLVPVPARPPLTRSQFEEARAHWPTSF 150 GUAD_BACSU 1 --------------------MNHETFLKRAVTLACEGVNAGIGGPFGAVI 30 ...:|.::|||..|......|:.. .|||: ADAT3_MOUSE 151 HEDKQVTSALAGQLFSTQERAAMQTHMERAVCAAQRAAAQGLRA-VGAVV 199 GUAD_BACSU 31 VKDGA--IIAEGQNNVTTSNDPTAHAEVTAI----------------RKA 62 |...: ::|.| ::.::...|..||.:..| ..| ADAT3_MOUSE 200 VDPASDRVLATG-HDCSSVASPLLHAVMVCIDLVAQGQGRGSCDLRSHPA 248 GUAD_BACSU 63 CKVLGA-----------YQLDD------CI---LYTSCEPCPMCLGAIYW 92 |....| .:||: |. ||.:.|||.||..|:.. ADAT3_MOUSE 249 CSFTQATATQGARAGSVRKLDEDSLPYVCTGYDLYVTREPCVMCAMALVH 298 GUAD_BACSU 93 ARPKAVFYAAEHTDAAEAGFDDSFIYKEIDKPAEERTIPFYQVTLTE--- 139 ||.:.|||.|...|.|. ..:::...:|........::..|.: ADAT3_MOUSE 299 ARIQRVFYGAPSPDGAL-----GTLFRVHARPDLNHRFQVFRGILEDQCR 343 GUAD_BACSU 140 HLSPFQAWRNFANKKEY 156 .|.|.. ADAT3_MOUSE 344 QLDPDP----------- 349 #---------------------------------------и вес выранивания 75.5.
Для построения частичного выравнивания последовательностей белка GUAD_BACSU и родственного ему белка ADAT3_MOUSE выполним команду:
water sw:guad_bacsu sw:adat3_mouse bigalignment.water -autoПрограмма выдаст нам файл bigalignment.water, в котором можно увидеть полученное частичное выравнивание:
#======================================= GUAD_BACSU 4 ETFLKRAVTLACEGVNAGIGGPFGAVIVKDGA--IIAEGQNNVTTSNDPT 51 :|.::|||..|......|:.. .|||:|...: ::|.| ::.::...|. ADAT3_MOUSE 174 QTHMERAVCAAQRAAAQGLRA-VGAVVVDPASDRVLATG-HDCSSVASPL 221 GUAD_BACSU 52 AHAEVTAI----------------RKACKVLGA-----------YQLDD- 73 .||.:..| ..||....| .:||: ADAT3_MOUSE 222 LHAVMVCIDLVAQGQGRGSCDLRSHPACSFTQATATQGARAGSVRKLDED 271 GUAD_BACSU 74 -----CI---LYTSCEPCPMCLGAIYWARPKAVFYAAEHTDAA 108 |. ||.:.|||.||..|:..||.:.|||.|...|.| ADAT3_MOUSE 272 SLPYVCTGYDLYVTREPCVMCAMALVHARIQRVFYGAPSPDGA 314 #---------------------------------------и вес выранивания 95.5.
- В частичное выравнивание вошёл участок последовательности моего белка от 4 до 108 а/о и родственного ему от 174 до 314 а/о.
- Локальное выравнивание совпадает с "ограничением" глобального на этот участок.
- Больший вес имеет локальное выравнивание (95.5 у локального и 75.5 у глобального). Я думаю, что вес оптимального глобального выравнивания не может быть больше веса оптимального локального выравнивания из-за того, что в глобальном могут быть такие участки, которые "минусуют" общий вес, а у локального они сведены к минимуму.
Наверх