Глобальное и локальное выравнивание аминокислотных последовательностей

Программы, с которыми мы работали - это программы пакета EMBOSS для построения выравниваний. Needle - программа для постпроения глобального выравнивания, matcher и water - для локального.

Матрица переходов.

Для того, чтобы лучше понять механизм, по которому программы делают локальное и глобальное выравнивание. Мы сделали матрицу переxдов для двух небольших последовательностей вручную.
Последовательности для глобального выравнивания: 1) VLDEG 2) LDE
Последовательности для локального выравнивания: 1)KQYLELMQK 2) QYMQK.


Мы использовали параметры:

В итоге были получены две матрицы переходов:
1)по глобальному выравниванию.

Зеленым цветом обозначен оптимальный путь. Цифра самой нижней клеточке - это вес этого выравнивания.
Само выравнивание выглядит так:

2)По локальному выравниванию.

Зеленым цветом обозначен оптимальный путь, а голубым - субоптимальный. Цифра в нижней голубой клеточке - вес за субоптимальное выравнивание, а в нижней зеленой - за опимальное.
Сами выравнивания выглядят так:
опимальное субоптимальное

Поиск участков локальной гомологии.

Локальное выравнивание в программе matcher мы делали для последова тельности белка ThyA_ECOLI: MKQYLELMQKVLDEGTQKNDRTGTGTLSIFGHQMRFNLQDGFPLVTTKRCHLRSIIHELL WFLQGDTNIAYLHENNVTIWDEWADENGDLGPVYGKQWRAWPTPDGRHIDQITTVLNQLK NDPDSRRIIVSAWNVGELDKMALAPCHAFFQFYVADGKLSCQLYQRSCDVFLGLPFNIAS YALLVHMMAQQCDLEVGDFVWTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIF DYRFEDFEIEGYDPHPGIKAPVAI
и некой последовательности (seq3), которая была создана из каких-то двух кусочков последовательности белка ThyA_ECOLI: ELMQKVLDEGFEIEGYDPHP

Программа matcher выдала нам три варианта выравнивания. Причем 1 и 2 с одержали в себе приблизительно одинаковые кусочки seq3, выровненные с разными участками ThyA_ECOLI.

После анализа этих трех выравниваний я выбрала два, на основе которых мож но понять, из каких частей ThyA_ECOLI была составлена последовательность seq3.

Выравнивание 1
          250      
  ThyA EDFEIEGYDPHP
       : ::::::::::
  seq3 EGFEIEGYDPHP
       10        20


Выравнивание 3
          10     
  ThyA ELMQKVLDEG
       ::::::::::
  seq3 ELMQKVLDEG
               10
                         
Seq3 = 6 [ELMQKVLDEG]15 + 247[FEIEGYDPHP]256

Влияние параметров на глобальное выравнивание.

Сравним двa глобальных выравнивание. Одно было построено на основе матрицы EBLOSUM62, цена за открытие делеции -10, за её продолжение -1. А второе на основе матрицы EBLOSUM40, цена за открытие делеции -1, з а её продолжение -1. В итоге были получены вот такие выравнивания:

Matrix: EBLOSUM62
Gap_penalty: 10.0
Extend_penalty: 1.0

Length: 264
Identity:      12/264 ( 4.5%)
Similarity:    14/264 ( 5.3%)
Gaps:         244/264 (92.4%)
Score: 60.0

ThyA  201 WTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIFD
                                           ...:.:.|
seq3    1                                  ELMQKVLD


Matrix: EBLOSUM40 Gap_penalty: 1.0 Extend_penalty: 1.0 Length: 264 Identity: 15/264 ( 5.7%) Similarity: 19/264 ( 7.2%) Gaps: 244/264 (92.4%) Score: 120.0

ThyA  201 WTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIFD
                                |   |  :   :|   ::|
seq3    1                       E---L--M---QK---VLD

Т.к. в первом случае очень большая цена за открытие делеции, их вовсе нет, поскольку это не окупалось бы получившимися совпадениями. Во втором случае штраф за открытие и продолжение делеции маленький, поэтому в выравнивании их очень много. И это полностью окупается получившимися совпадениями - вес второго выравнивания больше, чем первого.

На главную страницу