Главная страница > Второй семестр > Матрицы замен  

Матрицы весов аминокислотных замен


    Изучение матрицы BLOSUM62

    Были вычислены средние веса замен между различными аминокислотными остатками группы N D E Q (W1) и группы M I L V (W2), а также между этими группами (W12). Для вычислений использовалась электронная таблица Excel (см. blosum62.xls), результаты приведены ниже:
        W1 = 0.83
        W2 = 1.67
        W12 = – 2.56
    Средние веса замен между аминокислотными остатками внутри каждой из групп оказались больше среднего веса замен между этими группами (W1 > W12 и W2 > W12). Это связано с тем, что каждая из групп включает в себя аминокислоты, близкие по физико-химическим свойствам. N, D, E и Q — аминокислоты с отрицательно заряженными (за счет карбоксильной группы) боковыми цепями и их амиды; M, I, L и V — аминокислоты с алифатическими гидрофобными боковыми цепями, включающими 3–4 атома углерода. В связи с тем, что замены на сходные аминокислотные остатки в наимешьшей степени влияют на третичную структуру и, следовательно, на выполнение белком его функции, они встречаются чаще, чем замены на существенно различные аминокислотные остатки. В результате средние веса замен W1 и W2 оказываются выше W12.
    Средний вес замен между аминокислотными остатками внутри первой группы больше среднего веса замен между аминокислотными остатками второй группы (W1 > W2). Это позволяет говорить о том, что группа N D E Q более разнородна, чем группа M I L V. Возможно, это связано с тем, что гидрофобные взаимодействия, в которые способны вступать остатки M, I, L и V, менее специфичны, чем водородные и ионные взаимодействия, характерные для остатков N, D, E и Q. Кроме того, N и Q не заряжены, а D и E заряжены отрицательно при pH = 7, что также играет роль.


    Вычисление весов замен аминокислотных остатков на основе одного "блока" и на основе большой выборки

    Для проведения вычислений был выбран блок IPB001347A (SIS), содержащий 679 последовательностей, состоящих из 11 аминокислотных остатков. Данные о количестве различных пар аминокислотных остатков в блоке были получены с помощью программы pairs_count.exe (процент идентичности взят равным 62).
    Были рассчитаны веса аминокислотных замен для трех пар аминокислот: D — D, D — N (сходные аминокислоты), D — K (существенно различные аминокислоты). Для вычислений использовалась следующая формула:
        WAB = 2 * log2 [NAB / (N * pA * pB)],
где WAB — вес замен между аминокислотами A и B, NAB — количество пар A — B, N — общее количество пар, pA — частота аминокислоты A, pB — частота аминокислоты B.
    Сходным образом были рассчитаны веса замен аминокислотных остатков на основе большой выборки (200 блоков). Вычисления проводились с помощью Excel (см. pairs.xls, лист pairs); результаты приведены ниже (для сравнения приведены веса замен, взятые из матрицы BLOSUM62):

Пара аминокислот Веса замен, вычисленные по данным блока SIS Веса замен, вычисленные по данным 200 блоков Веса замен, взятые из матрицы BLOSUM62
D — D 1 4 6
D — N –1 2 1
D — K –6 1 –1

    В качестве меры степени различий вычисленных весов замен аминокислотных остатков и весов замен, взятых из матрицы BLOSUM62, использовалась следующая сумма квадратов отклонений:
        K = Σ (Ci — Mi)2,
где Ci — вычисленный вес i-й аминокислотной пары, Mi — вес i-й аминокислотной пары, взятый из матрицы BLOSUM62. Расчеты проводились с помощью Excel (см. pairs.xls, лист comparison).
    Веса замен, вычисленные по данным одного блока, больше отличаются от BLOSUM62, чем веса замен, вычисленные по данным 200 блоков (в первом случае K = 54, во втором — K = 9). Таким образом, ошибки, обусловленные конечным объемом выборки, существенно влияют на степень различий весов замен, и отклонения от BLOSUM62 можно объяснить недостаточными объемами выборок, использованных при вычислениях.



© Куравский Михаил Львович