Парные выравнивания белков. Применение алгоритмов парных выравниваний к белку THIE_BACSU.


1. Сравнение матриц аминокислотных замен

Матрицы типа BLOSUM62 и типа PHAT отличаются, в первую очередь, исходными данными, поступающими для обработки. Матрица BLOSUM62 ориентирована на белки цитоплазмы, тогда как при составлении матрицы типа PHAT использовались последовательности мембранных белков. Это было сделано из-за того, что у трансмембранных участков белков сильно изменены частоты аминокислот (меньше заряженных, больше неполярных). В связи с этим использование матрицы BLOSUM приводит к ошибочному пониманию эволюции этих участков.

Одним из примеров матрицы, основанной на данных о последовательностях трансмембранных участков белков, является матрица PHAT (predicted hydrophobicand transmembrane regions, A Transmembrane-Specific Substitution Matrix), основанная на гидрофобных и трансмембранных доменах в последовательностях белков из базы данных Blocks.


Цифра 62 в названии матрицы BLOSUM62 – это порог кластеризации (процент сходства, выше которого последовательности считаются идентичными и объединяются в один кластер). Кластеры учитывают при построении матриц, чтобы правильно определить вероятность.

Использование для различных групп белков различных матриц обусловлено различиями во встречаемости в них аминокислот. Это в свою очередь в большой степени обусловлено тем, где локализован в клетке определённый белок. Например, для мембранных белков, в которых есть трансмембранные тяжи из гидрофобных остатков и некоторые другие особенности, используются матрицы типа PHAT, в то время как матрицы типа BLOSUM применимы в основном к цитоплазматическим белкам.

При имеющихся матрицах BLOSUM62 и PHAT была самостоятельно построена матрица BLOSUM62.

Далее сравнили значения аминокислотных замен аспартата (аспарагиновой кислоты) для трёх различных матриц:

ASP (D) Gly Pro Cys Ser Thr Asn Gln Asp Glu His Arg Lys Ala Met Ile Leu Val Phe Trp Tyr
G P C S T N Q D E H R K A M I L V F W Y
BLOSUM_62 -1 -1 -3 0 -1 1 0 6 2 -1 -2 -1 -2 -3 -3 -4 -3 -3 -4 -3
PHAT -2 -5 -7 -4 -5 2 0 12 6 -1 -7 -5 -5 -5 -5 -5 -5 -5 -7 -4
My own -2 -1 -4 -1 -1 1 0 6 2 -1 -1 0 -2 -4 -4 -4 -4 -4 -3 -3

Значения классической и реконструированной матриц BLOSUM62 отличаются, так как для ручного построения матрицы использовалась более новая версия BLOCKS. Однако, построены они по одному алгоритму, что объясняет незначительность отличий. Значения матрицы PHAT отличается от значений матрицы BLOSUM из-за применения их к различным белкам (мембранным и цитоплазматическим соответственно).

Замена Asp на саму себя оценивается большим весом (12) в PHAT и меньшим весом в BLOSUM (6), да и в целом PHAT характерны более крупные значения (по модулю). Зная о том, как рассчитывается такая матрица, можно заключить, что Asp намного реже встречается в мембранных белках, поэтому их совпадение в выравнивании оценивается дороже.

Glu – аминокислота, близкая по химическим свойствам аспарагиновой кислоте. У цитоплазматических белков (матрица BLOSUM) вероятность замены Asp на Glu мала (равна 2). А вот в мембранных белках такая замена происходит чаще, о чем свидетельствует значение 6 в матрице PHAT. Наиболее «неудачные» замены – замены Asp на аминокислоты из других функциональных групп. Они характеризуются наибольшими по модулю и отрицательными по знаку значениями в матрицах.

Для мембранных белков самой «неудачной» является замена на триптофан, цистеин и аргинин (значение в PHAT: -7). Объяснить это можно наличием у этих аминокислот неполярных (гидрофобного) радикалов, в то время, как Asp имеет полярный отрицательно заряженный радикал. Очевидно, что замена Asp на Trp, Arg или Cys приведет к сильным (и вряд ли желаемым) изменениям в данной позиции последовательности. Для цитоплазматических белков самой «неудачной» является замена на цистеин, лейцин, изолейцин, валин, метионин и фенилаланин, потому что они тоже имеют гидрофобные радикалы.


2.
Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

Needle - программа из пакета EMBOSS, которая позволяет строить оптимальное глобальное выравнивание при стандартных параметрах (их значения указаны в скобках): Программа работает по алгоритму Нидлмана-Вунша, пытаясь выровнять полноразмерные последовательности.

Water – еще одна программа из пакета EMBOSS, которая строит локальные оптимальные выравнивания. Ее стандартные параметры аналогичны таковым у программы needle.

Программа работает по алгоритму Смита-Ватермана, который ищет схожие части белковой последовательности.

Ниже приведено сравнение характеристик ручного выравнивания с выравниваниями, проделанными описанными программами:


Выравнивание с мутантом №1 (-c 0.6 –r 0.6)
THIE_BACSU    1 MTRISREMMKELLSVYFIMGSNNTKADPVTVVQKALKGGATLYQFREKGG 50
                                           ..|.|.||||||.. :.|:|| 
generations=1 1 ---------------------------TGTYVCKALKGGRE-HIFKEK-- 20

THIE_BACSU    51 DALTGEARIKFAEKAQAACREAGVPFIVNDDVELALNLKADGIHIGQEDA 100

generations=1 20 -------------------------------------------------- 20

THIE_BACSU   101 NAKEVRAAIGDMILGVSAHTMSEVKQAEEDGADYVGLGPIYPTETKKDTR 150

generations=1 20 -------------------------------------------------- 20

THIE_BACSU   151 AVQGVSLIEAVRRQGISIPIVGIGGITIDNAAPVIQAGADGVSMISAISQ 200

generations=1 20 -------------------------------------------------- 20

THIE_BACSU   201 AEDPESAARKFREEIQTYKTGR 222

generations=1 20 ---------------------- 20
Сверху выравнивание needle, снизу water.
THIE_BACSU   30 TVVQKALKGGATLYQFREK 48
                |.|.||||||.. :.|:||
generations=1 3 TYVCKALKGGRE-HIFKEK 20
Сравнение:

  % идентичности % сходства Вес
вручную 47,6 66,7 34
needle 52,3 61,9 36
water 57,9 68,6 40

Выравнивание с мутантом №2 (-c 0.6 –r 0.8)
THIE_BACSU    1 MTRISREMMKELLSVYFIMGSNNTKADPVTVVQKALKGGATLYQFREKGG 50

generations=1 0 -------------------------------------------------- 0

THIE_BACSU    51 DALTGEARIKFAEKAQAACREAGVPFIVNDDVELALNLKADGIHIGQEDA 100

generations=1 0 -------------------------------------------------- 0

THIE_BACSU  101 NAKEVRAAIGDMILGVSAHTMSEVKQAEEDGADYVGLGPIYPTETKKDTR 150
                  :|..|.:.:..|.:|.:|:. 
generations=1 1 --EEKPAMVKNCCLIMSTNTIG---------------------------- 20

THIE_BACSU   151 AVQGVSLIEAVRRQGISIPIVGIGGITIDNAAPVIQAGADGVSMISAISQ 200

generations=1 20 -------------------------------------------------- 20

THIE_BACSU   201 AEDPESAARKFREEIQTYKTGR 222

generations=1 20 ---------------------- 20
Сверху выравнивание needle, снизу water.
THIE_BACSU  103 KEVRAAIGDMILGVSAHTM 121
                :|..|.:.:..|.:|.:|:
generations=1 1 EEKPAMVKNCCLIMSTNTI 19
Сравнение:

  % идентичности % сходства Вес
вручную 25 50 18
needle 25 55 17
water 26,3 57,9 17

Выравнивание с мутантом №3 (-c 0.4 –r 0.8)
THIE_BACSU    1 MTRISREMMKELLSVYFIMGSNNTKADPVTVVQKALKGGATLYQFREKGG 50

generations=1 0 -------------------------------------------------- 0

THIE_BACSU   51 DALTGEARIKFAEKAQAACREAGVPFIVNDDVELALNLKADGIHIGQEDA 100

generations=1 0 -------------------------------------------------- 0

THIE_BACSU  101 NAKEVRAAIGDMILGVSAHTMSEVKQAEEDGADYVGLGPIYPTETKKDTR 150

generations=1 0 -------------------------------------------------- 0

THIE_BACSU  151 AVQGVSLIEAVRRQGISIPIVGIGGITIDNAAPVIQAGADGVSMISAISQ 200
                                                               |||
generations=1 1 -----------------------------------------------ISQ 3

THIE_BACSU  201 AEDPESAARKFREEIQTYKTGR 222
                .|||||||||.|||||| 
generations=1 4 CEDPESAARKAREEIQT----- 20
Сверху выравнивание needle, снизу water.
THIE_BACSU  198 ISQAEDPESAARKFREEIQT 217
                |||.|||||||||.||||||
generations=1 1 ISQCEDPESAARKAREEIQT 20
Сравнение:

  % идентичности % сходства Вес
вручную 90 90 85
needle 90 90 85
water 90 90 85



© Novikova Maria, 2012
Последнее обновление: 19.02.2013