Глобальное и локальное выравнивание аминокислотных последовательностей
Программы с помощью которых составлялись выравнивания: операционная система семейства UNIX, пакет программ EMBOSS(needle, matcher), BLAST.
Матрица переходов
Универсальные параметры построения матриц: вес совпадения = 2; вес замены = -1; штраф за делецию = -2.
Глобальное выравнивание.
Последовательности, для которых строилась матрица: Y A E H G; A E H
Полученное выравнивание:
Y |
A |
E |
H |
G |
- |
A |
E |
H |
- |
Локальное выравнивание.
Последовательности, для которых строилась матрица:E W S G E Y I S P; W S I S P
Полученные выравнивания:
E |
W |
S |
G |
E |
Y |
I |
S |
P |
- |
W |
S |
- |
- |
- |
- |
- |
- |
E |
W |
S |
G |
E |
Y |
I |
S |
P |
- |
- |
- |
- |
- |
- |
I |
S |
P |
Поиск участков локальной гомологии
Последовательность белка METJ_ECOLI: MAEWSGEYISPYAEHGKKSEQVKKITVSIPLKVLKILTDERTRRQVNNLRHATNSELLCEAFLHAFTGQPLPD DADLRKERSDEIPEAAKEIMREMGINPETWEY
Выравниваемая последовательность: Координаты участков второй последовательности в белке METJ_ECOLI(7-16;88-97):
MAEWSGEYISPYAEHGKKSEQVKKITVSIPLKVLKILTDERTRRQVNNLRHATNSELLCEAFLHAFTGQPLPD
DADLRKERSDEIPEAAKEIMREMGINPETWEY Таблица локальных выравниваний Влияние параметров на глобальное выравнивание Выравнивания needle40_1_1, needle62_1_1 и needle80_1_1 отличаются только весом.
Выравнивания needle62_10_1 и needle80_1_1 сильнее всех различаются по значению"score"(60 и 110 соответственно), и кроме того имеют разные структуры. M = EBLOSUM62, GO = 10, GE = 1 M = EBLOSUM80, GO = 1, GE = 1 В первом выравнивании отсутствуют делеции так как их открытие не выгодно
из-за высокого штрафа(GO=10). При снижении штрафа за открытие делеции до 1 появляются гэпы,
выравнивапие приобретает структуру одинаковую для разных матриц и возрастает значение
"score". Для матрицы EBLOSUM80 вес выравнивания максимальный.
EYISPYAEHGAAKEIMREMG
10 20
EYISPYAEHGKKSEQVKKI
:::::::::: .: ....
EYISPYAEHGAAKEIMREM
10
90
AAKEIMREMG
::::::::::
AAKEIMREMG
20
1 MAEWSGEYISPYAEHGKKSEQVKKITVSIPLKVLKILTDERTRRQVNNLR 50
||||||||||...|.::::.
1 EYISPYAEHGAAKEIMREMG 20
51 HATNSELLCEAFLHAFTGQPLPDDADLRKERSDEIPEAAKEIMREMGINP 100
101 ETWEY 105
1 MAEWSGEYISPYAEHG-KKSEQV-KKITVSIPLKVLKILTDERTRRQVNN 48
|||||||||| .| | : :::.
1 EYISPYAEHGAAK-E-IMREMG 20
49 LRHATNSELLCEAFLHAFTGQPLPDDADLRKERSDEIPEAAKEIMREMGI 98
99 NPETWEY 105