На главную страницу
На главную страницу второго семестра

Матрицы замен

Изучение матрицы BLOSUM62

Полученные средние веса замен аминокислот для групп:

Среднее ACST 0
Среднее ACST 0.8333
Средний вес замен между группами –0.8125
Расчет приведен в файле blosum62.xls (лист "Средний вес")

Вычисление весов замен аминокислот

На основе блока IPB006151B вычислил частоты трех аминокислот (A, M и N). Эти остатки мало похожи друг на друга.
Далее по формуле
WXY = log2(NXY/(N*pXpY))
где NXY – число пар X–Y в блоке, N – общее число пар, pX – частота X
получил веса замен аминокислоты A на A, M и N. Для пары X–X число NXX надо умножить на 2.
Полученные значения:

Частоты аминокислот
  A
A 0,13
N 0,036
M 0,02
  Веса замен
  A
A 2,553
N 0,114
M 0,409

Для подсчета использована программа MsExcel (файл blosum62.xls, лист "Вес"), а также прогрумма pairs_count.exe.

Аналогично подсчитаны веса замен на основе большой выборки (на основе 200 блоков из банка данных BLOCKS). Результаты:

Частоты аминокислот
  A
A 0,078
N 0,041
M 0,024
  Веса замен
  A
A 2,887
N 0,454
M 0,83

Веса соответствующих замен из матрицы BLOSUM62:
  A
A 4
N –2
M –1

Из сравнения полученных весов видно, что один блок – статистически недостоверная выборка. Данные, полученные на основе 200 блоков ближе к матрице BLOSUM62, так как выборка более достоверная. Действительно,
(2,887 – 0,454)/(2,887 – 0,83) = 1,183 ≈ 6/5.


©Семенюк Павел