Глобальное и локальное выравнивание аминокислотных последовательностей
Программы, с которыми мы работали - это программы пакета EMBOSS для построения выравниваний. Needle - программа для постпроения глобального выравнивания, matcher и water - для локального.
Матрица переходов.
Для того, чтобы лучше понять механизм, по которому программы делают
локальное и глобальное выравнивание. Мы сделали матрицу переxдов для двух
небольших последовательностей вручную.
Последовательности для глобального выравнивания: 1) VLDEG 2) LDE
Последовательности для локального выравнивания: 1)KQYLELMQK 2) QYMQK.
Мы использовали параметры:
В итоге были получены две матрицы переходов:
1)по глобальному выравниванию.
Зеленым цветом обозначен оптимальный путь.
Цифра самой нижней клеточке - это вес этого выравнивания.
Само выравнивание выглядит так:
2)По локальному выравниванию.
Зеленым цветом обозначен оптимальный путь, а голубым - субоптимальный.
Цифра в нижней голубой клеточке - вес за субоптимальное
выравнивание, а в нижней зеленой - за опимальное.
Сами выравнивания выглядят так:
опимальное
![]() |
субоптимальное
![]() |
Поиск участков локальной гомологии.
Локальное выравнивание в программе matcher мы делали для последова
тельности белка ThyA_ECOLI:
MKQYLELMQKVLDEGTQKNDRTGTGTLSIFGHQMRFNLQDGFPLVTTKRCHLRSIIHELL
WFLQGDTNIAYLHENNVTIWDEWADENGDLGPVYGKQWRAWPTPDGRHIDQITTVLNQLK
NDPDSRRIIVSAWNVGELDKMALAPCHAFFQFYVADGKLSCQLYQRSCDVFLGLPFNIAS
YALLVHMMAQQCDLEVGDFVWTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIF
DYRFEDFEIEGYDPHPGIKAPVAI
и некой последовательности (seq3), которая была создана из каких-то
двух кусочков последовательности белка ThyA_ECOLI: ELMQKVLDEGFEIEGYDPHP
Программа matcher выдала нам три варианта выравнивания. Причем 1 и 2 с одержали в себе приблизительно одинаковые кусочки seq3, выровненные с разными участками ThyA_ECOLI.
После анализа этих трех выравниваний я выбрала два, на основе которых мож но понять, из каких частей ThyA_ECOLI была составлена последовательность seq3.
Выравнивание 1 250 ThyA EDFEIEGYDPHP : :::::::::: seq3 EGFEIEGYDPHP 10 20 |
Выравнивание 3 10 ThyA ELMQKVLDEG :::::::::: seq3 ELMQKVLDEG 10 |
Влияние параметров на глобальное выравнивание.
Сравним двa глобальных выравнивание. Одно было построено на основе матрицы EBLOSUM62, цена за открытие делеции -10, за её продолжение -1. А второе на основе матрицы EBLOSUM40, цена за открытие делеции -1, з а её продолжение -1. В итоге были получены вот такие выравнивания:Matrix: EBLOSUM62 Gap_penalty: 10.0 Extend_penalty: 1.0 Length: 264 Identity: 12/264 ( 4.5%) Similarity: 14/264 ( 5.3%) Gaps: 244/264 (92.4%) Score: 60.0
ThyA 201 WTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIFD ...:.:.| seq3 1 ELMQKVLD
Matrix: EBLOSUM40 Gap_penalty: 1.0 Extend_penalty: 1.0 Length: 264 Identity: 15/264 ( 5.7%) Similarity: 19/264 ( 7.2%) Gaps: 244/264 (92.4%) Score: 120.0
ThyA 201 WTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIFD | | : :| ::| seq3 1 E---L--M---QK---VLD
Т.к. в первом случае очень большая цена за открытие делеции, их вовсе нет, поскольку это не окупалось бы получившимися совпадениями. Во втором случае штраф за открытие и продолжение делеции маленький, поэтому в выравнивании их очень много. И это полностью окупается получившимися совпадениями - вес второго выравнивания больше, чем первого.