Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Сравнение матриц аминокислотных замен
Матрица BLOSUM (BLOcks SUbstitution Matrix) - матрица, которая позволяет оценивать качество выравнивания. Она содержит данные о заменах аминокислот на другие и самих себя. Матрица построена по данным базы BLOCKS и описывает преимущественно цитоплазматические белки. У матриц типа BLOSUM может быть разный порог кластеризации. У BLOSUM62 он равен 62, это значит, что выравнивания с процентом идентичности больше либо равному 62% образуют кластер и принимаются за одно выравнивание. Матрица PHAT построена по данным о мембранных белках, поэтому значения весов замен в ней отличаются.
Ниже приведена таблица весов для замен аминокислоты цистеин на саму себя, аминокислоты, схожие по свойствам и на аминокислоту, отличающуюся по свойствам.
Однобуквенное название аминокислоты | Трехбуквенное название аминокислоты | BLOSUM, полученная вручную | BLOSUUM62, классическая | PHAT |
C | Cys | 9 | 9 | 7 |
S | Ser | 0 | -1 | 1 |
T | Thr | -1 | -1 | -1 |
R | Arg | -3 | -3 | -8 |
E | Glu | -4 | -4 | -7 |
Некоторые комментарии по поводу различия в значениях замен.
В случае замены аминокислоты на саму себя значения весов идентичны для матрицы BLOSUM, построенной вручную и классической матрицей. Это произошло потому, что обе матрицы построены по одним и тем же данным. Однако, есть некоторые отличия на единицу для значений весов. Например, при замене цистеина на серин значения 0 и -1. Возможно, это произошло потому, что при построении матрицы вручную не были учтены гэпы. Существенно в большинстве случаев отличаются значения весов для матрицы PHAT. Как было сказано ранее, это произошло потому, что PHAT построена на сонове данных о мембранных белках. Так, при замене цистеина на аргинин значение веса для PHAT на 5 единиц меньше, чем для BLOSUM. Это означает, что цистеин на аргинин заменяется карйне редко. Это можно объяснить, исходя из того, что для мембранных белков важны такие свойства, как гидрофильность, гидрофобность и заряд. То есть крайне нежелательно заменять зряженную аминокислоту на незаряженную.
Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана
Программа needle из пакета EMBOSS реализуeт алгоритм Нидлмана-Вунша, а программа water - алгоритм Смита-Ватермана. Эти программы предназначены для парного выравнивания последовательностей. Алгоритм Нидлмана-Вунша представляет собой глобальное выравнивание, т.е сопоставляет полноценные последовательности. Алгоритм Смита-Ватермана произовдит локальное выравнивание, т.е. ищет наиболее идентичный участок последовательности. Оба алгоритма для построения наилучшего выравнивания используют веса замен из матрицы BlOSUM (по умолчанию - BLOSUM62). У каждой команды (needle и water) есть параметры, такие, как штраф за первый гэп и последующие. Именно их спрашивают на входе при работе с командами. Стандартный штраф за первый гэп -10, за последующий - 0.5
Мутант 1
ВРУЧНУЮ
Рис.1. Парное выравнивание мутанта 1 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.6, вероятность замены - 0.8.
Идентичность = 11/23 = 47,82%
Сходство =13/23 = 56,52 %
Вес по матрице BLOSUM62 = 39 (много аспарагина)
NEEDLE
MRGA_BACSU 51 EELYDHAAETVDTIAERLLAIGGQPVAT-VKEYTEHASITDGGNETSASE 99 |.:|..| .||.|||||... generations=1 1 ---------------------GQRPKCTNNKEMTEHASYIS--------- 20 Identity: 10/154 ( 6.5%) Similarity: 11/154 ( 7.1%) Score: 35.0
WATER
MRGA_BACSU 72 GGQPVAT-VKEYTEHAS 87 |.:|..| .||.||||| generations=1 1 GQRPKCTNNKEMTEHAS 17 Identity: 10/17 (58.8%) Similarity: 11/17 (64.7%) Score: 37.0
Мутант 2
ВРУЧНУЮ
Рис.2. Парное выравнивание мутанта 2 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.6, вероятность замены - 0.6.
Идентичность = 9/23 =39,1 %
Сходство = 12/23 = 52,17%
Вес по матрице BLOSUM62 = 23
NEEDLE
MRGA_BACSU 1 MKTENAKTNQTLVENSLNTQLSNWFLLYSKLHRFHWYVKGPHFFTLHEKF |...|||.|.:|.||. |.|. generations=1 1 MTWPNAKRNDSLEENK-NVQA----------------------------- Identity: 10/153 ( 6.5%) Similarity: 11/153 ( 7.2%) Score: 35.0
WATER
MRGA_BACSU 1 MKTENAKTNQTLVENSLNTQ 20 |...|||.|.:|.||. |.| generations=1 1 MTWPNAKRNDSLEENK-NVQ 19 Identity: 10/20 (50.0%) Similarity: 11/20 (55.0%) Score: 36.0
Мутант 3
ВРУЧНУЮ
Рис.3. Парное выравнивание мутанта 3 и исходной последовательности MRGA_BACSU. Красным цветом выделены гидрофобные аминокислоты, синим - отрицательно заряженные, фиолетовым - положительно заряженные, зеленым - с ароматическим радикалом, темно-бирюзовым - полярные незаряженные. Вероятность изменения остатка - 0.4, вероятность замены - 0.8.
Идентичность =13/21 = 61.9%
Сходство =13/21 = 61.9%
Вес по матрице BLOSUM62 = 38
NEEDLE
MRGA_BACSU 101 VQALVNDYKQISSESKFVIGLAEEN-QDNATADLFVGLIEEVEKQVWMLS 149 .|||| ||...|||.|.||| generations=1 1 --------------------WAEENLQDKFEADLGVKLIE---------- 20 Identity: 13/154 ( 8.4%) Similarity: 13/154 ( 8.4%) Score: 42.0
WATER
MRGA_BACSU 122 AEEN-QDNATADLFVGLIE 139 |||| ||...|||.|.||| generations=1 2 AEENLQDKFEADLGVKLIE 20 Identity: 13/19 (68.4%) Similarity: 13/19 (68.4%) Score: 44.0
Сравнение результатов выравниваний (проценты приведены для участка)
Для первого мутанта получаем:
Вручную:
идентичность- 47,82% сходство- 56,52 % вес- 39
Needle:
идентичность- 47,6%; сходство- 52,4%; вес- 35.0;
Water:
идентичность- 58.8%; сходство- 64,7%; вес- 37.
Для второго мутанта получаем:
Вручную:
идентичность- 39,1%; сходство- 52,17%; вес- 23;
Needle:
идентичность- 52,4%; сходство- 52,4%; вес- 35;
Water:
идентичность- 50%; сходство- 55%; вес- 36.
Для третьего мутанта получаем:
Вручную:
идентичность- 61.9%; сходство- 61.9%; вес- 38;
Needle:
идентичность- 61,9%; сходство- 61,9%; вес- 42;
Water:
идентичность- 68.4%; сходство- 68.4%; вес- 44.
Получаем, что очень похожи значения идентичности при выравнивании вручную и с помощью программы needle для первого и третьего мутанта, т.е. выравнивание вручную оказалось достаточно удасным в этих случаях. (но выравнивание вручную и с помощью программы не совпадают). Однако, для второго мутанта программа справилась лучше. Значения весов несколько отличаются. Для первого мутанта вес для выравнивания вручную даже выше, чем с помощью программы. Для второго же мутанта программа показала лучшие выравнивания по идентичности и по весу. Сравнивать значения параметров оценки с таковыми у выравниваний. полученных с помощью программы water не удобно, т.к. эти значения получены несколько иначе. Выбирались лишь саме похожие участки, т.е. длина последовательности меньше, чем 20.