Матрицы замен.

Задание 1: Вычислить средний вес замен между разными аминокислотами внутри первой группы (аминокислоты A, G, S, T) внутри второй группы (аминокислоты N, D, E, Q) и между группами (при подсчете среднего веса замен внутри группы нельзя находить среднее значение в квадрате (матрице) замен, а необходимо считать среднее значение в треугольной матрице). Замена аминокислот внутри группы имеет больший вес, чем замена между группами; замена очень близких аминокислот внутри группы имеет больший вес, чем замена менее похожих. Вес замены аминокислоты на ту же самую положителен.

Задания 2 и 3: Провести поиск блоков, относящихся к моему белку (поиск на странице "Get Blocks by keyword" по SwissProt AC белка).ВНИМАНИЕ! Увы, но блоков, относящихся к моему белку, не было найдено; именно поэтому задание выполнено по данным блока другого белка (тРНК изопентенилтрансферазы). С помощью программы pairs_count.exe получить таблицу количеств различных пар аминокислот в данном блоке. На основе полученных количеств пар рассчитать веса аминокислотных замен для трех пар аминокислот (выбрал R, H, W). Сравнить рассчитанные значения с соответствующими из матрицы blosum62:
Пара аминокислот nαβ pαβ qα qβ sαβ
R,R 5301 0,00921 0,0485 0,0485 5
R,H 641 0,00111 0,0485 0,03586 0
R,W 30 5,21*10-5 0,0485 0,00162 -3

Условные обозначения:
nαβ — общее количество пар в выравнивании;
pαβ — частота пары;
qα — частота аминокислоты α в паре;
qβ — частота аминокислоты β в паре;
sαβ — вес аминокислотной замены по Blosum62.

Расчеты и результаты можно посмотреть здесь (в файле несколько листов).
  При подсчете значений в матрице аминокислотных замен я подобрал основание логарифма так, чтобы вес замены R-R был равен весу замены R-R в Blosum62, а остальные веса округлил. Частоты аминокислот в первом случае были подсчитаны, в другом - взяты из AAfreq.txt. Определённый вывод сделать сложно, хотя очевидно, что чем больше выборок будет сделано, тем более точной будет матрица весов замен.
На главную страницу семестра


©Ларионов Дмитрий