Парные выравнивания белков. Применение алгоритмов парных выравниваний к белку MRGA_BACSU

Главная Семестры Проекты Заметки О себе Полезные ссылки



Сравнение матриц аминокислотных замен

Матрица BLOSUM (BLOcks SUbstitution Matrix) - матрица, которая позволяет оценивать качество выравнивания. Она содержит данные о заменах аминокислот на другие и самих себя. Матрица построена по данным базы BLOCKS и описывает преимущественно цитоплазматические белки. У матриц типа BLOSUM может быть разный порог кластеризации. У BLOSUM62 он равен 62, это значит, что выравнивания с процентом идентичности больше либо равному 62% образуют кластер и принимаются за одно выравнивание. Матрица PHAT построена по данным о мембранных белках, поэтому значения весов замен в ней отличаются.
Ниже приведена таблица весов для замен аминокислоты цистеин на саму себя, аминокислоты, схожие по свойствам и на аминокислоту, отличающуюся по свойствам.
Однобуквенное название аминокислоты Трехбуквенное название аминокислоты BLOSUM, полученная вручную BLOSUUM62, классическая PHAT
C Cys 9 9 7
S Ser 0 -1 1
T Thr -1 -1 -1
R Arg -3 -3 -8
E Glu -4 -4 -7


Некоторые комментарии по поводу различия в значениях замен.

В случае замены аминокислоты на саму себя значения весов идентичны для матрицы BLOSUM, построенной вручную и классической матрицей. Это произошло потому, что обе матрицы построены по одним и тем же данным. Однако, есть некоторые отличия на единицу для значений весов. Например, при замене цистеина на серин значения 0 и -1. Возможно, это произошло потому, что при построении матрицы вручную не были учтены гэпы. Существенно в большинстве случаев отличаются значения весов для матрицы PHAT. Как было сказано ранее, это произошло потому, что PHAT построена на сонове данных о мембранных белках. Так, при замене цистеина на аргинин значение веса для PHAT на 5 единиц меньше, чем для BLOSUM. Это означает, что цистеин на аргинин заменяется карйне редко. Это можно объяснить, исходя из того, что для мембранных белков важны такие свойства, как гидрофильность, гидрофобность и заряд. То есть крайне нежелательно заменять зряженную аминокислоту на незаряженную.


Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

Программа needle из пакета EMBOSS реализуeт алгоритм Нидлмана-Вунша, а программа water - алгоритм Смита-Ватермана. Эти программы предназначены для парного выравнивания последовательностей. Алгоритм Нидлмана-Вунша представляет собой глобальное выравнивание, т.е сопоставляет полноценные последовательности. Алгоритм Смита-Ватермана произовдит локальное выравнивание, т.е. ищет наиболее идентичный участок последовательности. Оба алгоритма для построения наилучшего выравнивания используют веса замен из матрицы BlOSUM (по умолчанию - BLOSUM62). У каждой команды (needle и water) есть параметры, такие, как штраф за первый гэп и последующие. Именно их спрашивают на входе при работе с командами. Стандартный штраф за первый гэп -10, за последующий - 0.5

Мутант 1

ВРУЧНУЮ



Рис.1. Парное выравнивание мутанта 1 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.6, вероятность замены - 0.8.

Идентичность = 11/23 = 47,82%
Сходство =13/23 = 56,52 %
Вес по матрице BLOSUM62 = 39 (много аспарагина)

NEEDLE

MRGA_BACSU        51 EELYDHAAETVDTIAERLLAIGGQPVAT-VKEYTEHASITDGGNETSASE     99 
                                          |.:|..| .||.|||||...                 
generations=1      1 ---------------------GQRPKCTNNKEMTEHASYIS---------     20 

Identity:      10/154 ( 6.5%) 
Similarity:    11/154 ( 7.1%) 
Score: 35.0


WATER

MRGA_BACSU        72 GGQPVAT-VKEYTEHAS     87
                     |.:|..| .||.|||||       
generations=1      1 GQRPKCTNNKEMTEHAS     17

Identity:      10/17 (58.8%) 
Similarity:    11/17 (64.7%)
Score: 37.0


Мутант 2

ВРУЧНУЮ



Рис.2. Парное выравнивание мутанта 2 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.6, вероятность замены - 0.6.

Идентичность = 9/23 =39,1 %
Сходство = 12/23 = 52,17%
Вес по матрице BLOSUM62 = 23

NEEDLE

MRGA_BACSU         1 MKTENAKTNQTLVENSLNTQLSNWFLLYSKLHRFHWYVKGPHFFTLHEKF
                     |...|||.|.:|.||. |.|.                             
generations=1      1 MTWPNAKRNDSLEENK-NVQA-----------------------------
Identity:      10/153 ( 6.5%)
Similarity:    11/153 ( 7.2%) 
Score: 35.0 

WATER

MRGA_BACSU 1 MKTENAKTNQTLVENSLNTQ 20 |...|||.|.:|.||. |.| generations=1 1 MTWPNAKRNDSLEENK-NVQ 19 Identity: 10/20 (50.0%) Similarity: 11/20 (55.0%) Score: 36.0


Мутант 3

ВРУЧНУЮ



Рис.3. Парное выравнивание мутанта 3 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.4, вероятность замены - 0.8.

Идентичность =13/21 = 61.9%
Сходство =13/21 = 61.9%
Вес по матрице BLOSUM62 = 38

NEEDLE

MRGA_BACSU       101 VQALVNDYKQISSESKFVIGLAEEN-QDNATADLFVGLIEEVEKQVWMLS    149
                                         .|||| ||...|||.|.|||                 
generations=1      1 --------------------WAEENLQDKFEADLGVKLIE----------     20  

Identity:      13/154 ( 8.4%)
Similarity:    13/154 ( 8.4%)
Score: 42.0


WATER

MRGA_BACSU       122 AEEN-QDNATADLFVGLIE    139   
                     |||| ||...|||.|.|||          
generations=1      2 AEENLQDKFEADLGVKLIE     20  

Identity:      13/19 (68.4%) 
Similarity:    13/19 (68.4%)
Score: 44.0


Сравнение результатов выравниваний (проценты приведены для участка)

Для первого мутанта получаем:
Вручную:
идентичность- 47,82% сходство- 56,52 % вес- 39
Needle:
идентичность- 47,6%; сходство- 52,4%; вес- 35.0;
Water:
идентичность- 58.8%; сходство- 64,7%; вес- 37.

Для второго мутанта получаем:
Вручную:
идентичность- 39,1%; сходство- 52,17%; вес- 23;
Needle:
идентичность- 52,4%; сходство- 52,4%; вес- 35;
Water:
идентичность- 50%; сходство- 55%; вес- 36.

Для третьего мутанта получаем:
Вручную:
идентичность- 61.9%; сходство- 61.9%; вес- 38;
Needle:
идентичность- 61,9%; сходство- 61,9%; вес- 42;
Water:
идентичность- 68.4%; сходство- 68.4%; вес- 44.

Получаем, что очень похожи значения идентичности при выравнивании вручную и с помощью программы needle для первого и третьего мутанта, т.е. выравнивание вручную оказалось достаточно удасным в этих случаях. (но выравнивание вручную и с помощью программы не совпадают). Однако, для второго мутанта программа справилась лучше. Значения весов несколько отличаются. Для первого мутанта вес для выравнивания вручную даже выше, чем с помощью программы. Для второго же мутанта программа показала лучшие выравнивания по идентичности и по весу. Сравнивать значения параметров оценки с таковыми у выравниваний. полученных с помощью программы water не удобно, т.к. эти значения получены несколько иначе. Выбирались лишь саме похожие участки, т.е. длина последовательности меньше, чем 20.