Матрицы замен.
Задание 1: Вычислить средний вес замен между разными аминокислотами внутри первой группы (аминокислоты A, G, S, T) внутри
второй группы (аминокислоты N, D, E, Q) и между группами (при подсчете среднего веса замен внутри группы нельзя
находить среднее значение в квадрате (матрице) замен, а необходимо считать среднее значение в треугольной матрице). Замена
аминокислот внутри группы имеет больший вес, чем замена между
группами; замена очень близких аминокислот внутри группы имеет больший вес, чем замена менее похожих. Вес замены
аминокислоты на ту же самую положителен.
Задания 2 и 3: Провести поиск блоков, относящихся к моему белку (поиск на странице "Get Blocks by keyword" по SwissProt AC
белка).ВНИМАНИЕ! Увы, но блоков, относящихся к моему белку, не было найдено; именно поэтому задание выполнено по данным блока другого белка (тРНК изопентенилтрансферазы). С помощью программы pairs_count.exe получить таблицу количеств различных пар аминокислот в данном блоке. На основе
полученных количеств пар рассчитать веса аминокислотных замен для трех пар аминокислот (выбрал R, H, W). Сравнить
рассчитанные значения с соответствующими из матрицы blosum62:
Пара аминокислот
|
nαβ
|
pαβ
|
qα
|
qβ
|
sαβ
|
R,R
|
5301
|
0,00921
|
0,0485
|
0,0485
|
5
|
R,H
|
641
|
0,00111
|
0,0485
|
0,03586
|
0
|
R,W
|
30
|
5,21*10-5
|
0,0485
|
0,00162
|
-3
|
Условные обозначения:
nαβ общее количество пар в выравнивании;
pαβ частота пары;
qα частота аминокислоты α в паре;
qβ частота аминокислоты β в паре;
sαβ вес аминокислотной замены по Blosum62.
Расчеты и результаты можно посмотреть
здесь (в файле несколько листов).
При подсчете значений в матрице аминокислотных замен я подобрал
основание логарифма так, чтобы вес замены R-R был равен весу замены R-R в
Blosum62, а остальные веса округлил. Частоты аминокислот в первом случае были
подсчитаны, в другом - взяты из AAfreq.txt.
Определённый вывод сделать сложно, хотя очевидно, что чем больше выборок будет сделано, тем более точной будет матрица весов замен.