Матрицы замен


 Изучение матрицы BLOSUM 62

  Матрица "Blosum 62" была импортирована в Excel и преобразована следующим образом:
Строки и столбцы были рассортированы по группам:

A,G,S,T
N,D,E,Q
K,R,H
M,I,L,V
F,Y,W
P
C.

Строки, относящиеся к разным группам, были выделены разными цветами. Результат был сохранён в файл blosum62.xls.

Далее были вычислены средние веса замен между аминокислотами внутри группы A,G,S,T, внутри группы N,D,E,Q и между этими группами.
Средний вес между аминокислотами внутри группы A,G,S,T равен 0,
Средний вес между аминокислотами внутри группы N,D,E,Q равен 0.83,
Средний вес между группами A,G,S,T и N,D,E,Q равен -0,81.


  Аминокислоты A,G,S,T схожи, но всё же имеют некоторые отличия в свойствах.
Аминокислоты N,D,E,Q по физико-химическим свойствам более схожи между собой, чем A,G,S,T. Поэтому средний вес между аминокислотами внутри группы N,D,E,Q больше, чем средний вес между аминокислотами внутри группы A,G,S,T.

  Свойства аминокислот A,G,S,T и N,D,E,Q значительно отличаются друг от друга. Поэтому средний вес между ними отрицателен.


 Вычисление весов замен аминокислот на основе одного "блока"

  На сайте базы данных BLOCKS (http://blocks.fhcrc.org), был выполнен поиск блоков, относящихся к белку GLK_ECOLI.

  Результат поиска находится на странице http://blocks.fhcrc.org/blocks-bin/getblock.sh?IPB003836.

  Самый широкий блок был сохранён и затем с помощью программы pairs_count.exe была получена таблицу количеств различных пар аминокислот в данном блоке.
  На основе полученных количеств пар были рассчитаны веса аминокислотных замен для следующих пар аминокислот:

T Thr     T Thr
T Thr     Y Tyr
T Thr     F Phe.

  Вес замены пары аминокислот равен отношению частоты встречаемости пары аминокислот к производению частот встречаемости каждой аминокислоты.
  Вычисление и значения весов амнокислотных замен представлены в файле Blocks.xls.



 Вычисление весов замен аминокислот на основе большой выборки

  Аналогичным образом были вычисл ены веса аминокислотных замен для трех пар аминокислот на основе 200 блоков из банка данных BLOCKS. Они также представлены в файле Blocks.xls.

Пара аминокислот Вес замен аминокислот на основе одного "блока" Вес замен аминокислот на основе большой выборки Вес замен аминокислот на основе матрицы Blosum 62
Thr          Thr 0 3 5
Thr          Tyr -4 2 -2
Thr          Phe -3 1 -2

  Вычисление веса аминокислотных замен на основе большой выборки (из 200 "блоков") является более точным, чем вычисление на основе одного "блока", т. к. используются более статистически широкие данные. Это объясняет то, что вес замен аминокислот на основе большой выборки, по сравнению с весом замен аминокислот на основе одного "блока", больше совпадает с весом замен аминокислот на основе матрицы Blosum 62.

На главную страницу второго семестра


©Дмитрий