Программы выравнивания.
Влияние параметров на глобальное выравнивание
Выравнивание последовательностей со схожей функцией (возможных гомологов)
и выравнивание последовательностей, содержащих общие участки.
На главную страницу второго семестра
Следующие глобальные выравнивания были построены для аминонокислотной последовательности
белка ASSY_ECOLI и искусственно созданной последовательности, состоящей из
двух участков вышеуказанной последовательности. Эти выравнивания строились с помощью программы NEEDLE из программного
пакета EMBOSS.
Первое выравнивание:
Параметры:
штраф за открытие делеции - 10
штраф за продолжение делеции - 1
Результаты выравнивания:
Length: 447 (длина глобального выравнивания)
Identity: 23/447 ( 5.1%) (процент идентичности глобального выравнивания)
Similarity: 23/447 ( 5.1%) (процент сходства глобального выравнивания)
Gaps: 424/447 (94.9%)
(суммарное количество гэпов глобального выравнивания)
Score: 104.0 (вес глобального выравнивания)
|
ASSY_ECOLI 1 MTTILKHLPVGQRIGIAFSGGLDTSAALLWMRQKGAVPYAYTANLGQPDE 50
||||||||||| ||||||||||||
ASSY_ECOLI 1 MTTILKHLPVG---GIAFSGGLDTSA------------------------ 23
ASSY_ECOLI 51 EDYDAIPRRAMEYGAENARLIDCRKQLVAEGIAAIQCGAFHNTTGGLTYF 100
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 101 NTTPLGRAVTGTMLVAAMKEDGVNIWGDGSTYKGNDIERFYRYGLLTNAE 150
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 151 LQIYKPWLDTDFIDELGGRHEMSEFMIACGFDYKMSVEKAYSTDSNMLGA 200
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 201 THEAKDLEYLNSSVKIVNPIMGVKFWDESVKIPAEEVTVRFEQGHPVALN 250
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 251 GKTFSDDVEMMLEANRIGGRHGLGMSDQIENRIIEAKSRGIYEAPGMALL 300
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 301 HIAYERLLTGIHNEDTIEQYHAHGRQLGRLLYQGRWFDSQALMLRDSLQR 350
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 351 WVASQITGEVTLELRRGNDYSILNTVSENLTYKPERLTMEKGDSVFSPDD 400
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 401 RIGQLTMRNLDITDTREKLFGYAKTGLLSSSAASGVPQVENLENKGQ 447
ASSY_ECOLI 24 ----------------------------------------------- 23
|
|
Второе выравнивание:
Параметры:
штраф за открытие делеции - 5
штраф за продолжение делеции - 1
Результаты выравнивания:
Length: 447 (длина глобального выравнивания)
Identity: 23/447 ( 5.1%) (процент идентичности глобального выравнивания)
Similarity: 23/447 ( 5.1%) (процент сходства глобального выравнивания)
Gaps: 424/447 (94.9%)
(суммарное количество гэпов глобального выравнивания)
Score: 109.0 (вес глобального выравнивания)
|
ASSY_ECOLI 1 MTTILKHLPVGQRIGIAFSGGLDTSAALLWMRQKGAVPYAYTANLGQPDE 50
||||||||||| ||||||||||||
ASSY_ECOLI 1 MTTILKHLPVG---GIAFSGGLDTSA------------------------ 23
ASSY_ECOLI 51 EDYDAIPRRAMEYGAENARLIDCRKQLVAEGIAAIQCGAFHNTTGGLTYF 100
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 101 NTTPLGRAVTGTMLVAAMKEDGVNIWGDGSTYKGNDIERFYRYGLLTNAE 150
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 151 LQIYKPWLDTDFIDELGGRHEMSEFMIACGFDYKMSVEKAYSTDSNMLGA 200
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 201 THEAKDLEYLNSSVKIVNPIMGVKFWDESVKIPAEEVTVRFEQGHPVALN 250
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 251 GKTFSDDVEMMLEANRIGGRHGLGMSDQIENRIIEAKSRGIYEAPGMALL 300
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 301 HIAYERLLTGIHNEDTIEQYHAHGRQLGRLLYQGRWFDSQALMLRDSLQR 350
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 351 WVASQITGEVTLELRRGNDYSILNTVSENLTYKPERLTMEKGDSVFSPDD 400
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 401 RIGQLTMRNLDITDTREKLFGYAKTGLLSSSAASGVPQVENLENKGQ 447
ASSY_ECOLI 24 ----------------------------------------------- 23
|
|
Третье выравнивание:
Параметры:
штраф за открытие делеции - 1
штраф за продолжение делеции - 1
Результаты выравнивания:
Length: 447 (длина глобального выравнивания)
Identity: 23/447 ( 5.1%) (процент идентичности глобального выравнивания)
Similarity: 23/447 ( 5.1%) (процент сходства глобального выравнивания)
Gaps: 424/447 (94.9%)
(суммарное количество гэпов глобального выравнивания)
Score: 113.0 (вес глобального выравнивания)
|
ASSY_ECOLI 1 MTTILKHLPVGQRIGIAFSGGLDTSAALLWMRQKGAVPYAYTANLGQPDE 50
||||||||||| ||||||||||||
ASSY_ECOLI 1 MTTILKHLPVG---GIAFSGGLDTSA------------------------ 23
ASSY_ECOLI 51 EDYDAIPRRAMEYGAENARLIDCRKQLVAEGIAAIQCGAFHNTTGGLTYF 100
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 101 NTTPLGRAVTGTMLVAAMKEDGVNIWGDGSTYKGNDIERFYRYGLLTNAE 150
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 151 LQIYKPWLDTDFIDELGGRHEMSEFMIACGFDYKMSVEKAYSTDSNMLGA 200
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 201 THEAKDLEYLNSSVKIVNPIMGVKFWDESVKIPAEEVTVRFEQGHPVALN 250
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 251 GKTFSDDVEMMLEANRIGGRHGLGMSDQIENRIIEAKSRGIYEAPGMALL 300
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 301 HIAYERLLTGIHNEDTIEQYHAHGRQLGRLLYQGRWFDSQALMLRDSLQR 350
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 351 WVASQITGEVTLELRRGNDYSILNTVSENLTYKPERLTMEKGDSVFSPDD 400
ASSY_ECOLI 24 -------------------------------------------------- 23
ASSY_ECOLI 401 RIGQLTMRNLDITDTREKLFGYAKTGLLSSSAASGVPQVENLENKGQ 447
ASSY_ECOLI 24 ----------------------------------------------- 23
|
|
На моем примере трудно проследить , но при повышении штрафа за
открытие гэпов, качество выравнивания повышается (это можно понять ,
если сравнить веса трех выравниваний). А при понижении штрафа за открытие
гэпов качество выравнивания снижется, из-за этого и повышается вес выравнивания
,по сравнению с тем выравнивание, где штраф за открытие гэпа равен 10.
Карта локального сходства
С помощью программы dotmatcher были построены карты локального
выравнивания из ASSY_ECOLI.fasta и искусственно созданной последовательности, состоящей из
двух участков вышеуказанной последовательности.
(Файлы dotmatcher.ps и dotmatcher1.ps)
При сравнении 2-х различных результатов (в первом размер окна 20, размер порога 23, во втором размер
окна 5, размер порога 10) можем сделать вывод: Линии на графике отражают схожесть выравнивания.
При изменении размера окна, мы тем самым изменяем размер (ширину) кусочка (window_size, минимальный размер
окна=3). Также мы можем отбрасывать выравнивания, вес которых ниже определённого уровня.
При помощи изменения значения порога (например, если мы ставим значение
порога равное 23, то все значения веса выравнивания ниже 23 будут отбрасываться!).
И из-за этого, при снижении порога на суммарный вес получается непонятная
картина из множества чёрточек. Такое выравнивание достоверно нам не отражает
суть картины, т.к. при таком выравнивании просто будет много случайных совпадений.
Если мы поставм порог, например, равным 100, а ширина окна 10, то скорее
всего картинка будет пуста, т.к. скорее всего такое выравнивание не сможет
набрать вес 100.
©Трембицкая Влада