Главная страница > Второй семестр > Матрицы замен
Были вычислены средние веса замен между различными аминокислотными остатками группы N D E Q (W1) и
группы M I L V (W2), а также между этими группами (W12).
Для вычислений использовалась электронная таблица Excel (см. blosum62.xls), результаты
приведены ниже:
W1 = 0.83
W2 = 1.67
W12 = 2.56
Средние веса замен между аминокислотными остатками внутри каждой из групп оказались больше среднего веса замен между этими группами
(W1 > W12 и W2 > W12). Это связано с тем, что каждая из групп включает в себя
аминокислоты, близкие по физико-химическим свойствам. N, D, E и Q аминокислоты с отрицательно заряженными (за счет карбоксильной
группы) боковыми цепями и их амиды; M, I, L и V аминокислоты с алифатическими гидрофобными боковыми цепями, включающими 34 атома углерода.
В связи с тем, что замены на сходные аминокислотные остатки в наимешьшей степени влияют на третичную структуру и, следовательно, на выполнение белком его функции, они
встречаются чаще, чем замены на существенно различные аминокислотные остатки. В результате средние веса замен W1 и W2 оказываются выше W12.
Средний вес замен между аминокислотными остатками внутри первой группы больше среднего веса замен между аминокислотными
остатками второй группы (W1 > W2). Это позволяет говорить о том, что группа N D E Q более разнородна,
чем группа M I L V. Возможно, это связано с тем, что гидрофобные взаимодействия, в которые способны вступать остатки M, I, L и V, менее специфичны, чем водородные
и ионные взаимодействия, характерные для остатков N, D, E и Q. Кроме того, N и Q не заряжены, а D и E заряжены отрицательно при pH = 7, что также
играет роль.
Для проведения вычислений был выбран блок IPB001347A (SIS), содержащий
679 последовательностей, состоящих из 11 аминокислотных остатков. Данные о количестве различных пар аминокислотных остатков
в блоке были получены с помощью программы pairs_count.exe (процент идентичности взят равным 62).
Были рассчитаны веса аминокислотных замен для трех пар аминокислот: D D, D N (сходные аминокислоты), D K (существенно
различные аминокислоты). Для вычислений использовалась следующая формула:
WAB = 2 * log2 [NAB / (N * pA * pB)],
где WAB вес замен между аминокислотами A и B, NAB количество пар A B, N общее количество пар,
pA частота аминокислоты A, pB частота аминокислоты B.
Сходным образом были рассчитаны веса замен аминокислотных остатков на основе большой выборки (200 блоков).
Вычисления проводились с помощью Excel (см. pairs.xls, лист pairs); результаты
приведены ниже (для сравнения приведены веса замен, взятые из матрицы BLOSUM62):
В качестве меры степени различий вычисленных весов замен аминокислотных остатков
и весов замен, взятых из матрицы BLOSUM62, использовалась следующая сумма квадратов отклонений:
© Куравский Михаил Львович
 
Пара аминокислот
Веса замен, вычисленные по данным блока SIS
Веса замен, вычисленные по данным 200 блоков
Веса замен, взятые из матрицы BLOSUM62
D D
1
4
6
D N
1
2
1
D K
6
1
1
K = Σ (Ci Mi)2,
где Ci вычисленный вес i-й аминокислотной пары, Mi
вес i-й аминокислотной пары, взятый из матрицы BLOSUM62. Расчеты проводились
с помощью Excel (см. pairs.xls, лист comparison).
Веса замен, вычисленные
по данным одного блока, больше отличаются от BLOSUM62, чем
веса замен, вычисленные по данным 200 блоков (в первом случае K = 54,
во втором K = 9). Таким образом, ошибки, обусловленные конечным объемом выборки, существенно влияют на степень различий весов замен, и отклонения от BLOSUM62 можно объяснить недостаточными объемами выборок, использованных при вычислениях.