На главную страницу второго семестра

Матрицы весов аминокислотных замен

Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку ACRB_ECOLI

Описание блока:
Block PR00702A
ID ACRIFLAVINRP; BLOCK
AC PR00702A; distance from previous block=(8,19)
DE Acriflavin resistance protein family signature
BL adapted; width=25; seqs=20; 99.5%=1380; strength=1175
веб-страница блока

                                            *                 2 0                    
A C R B _ E C O L I   :   R P I F A W V I A I I I M L A G G L A I L K L P V   :   2 5
A C R D _ E C O L I   :   R P I F A W V L A I L L C L T G T L A I F S L P V   :   2 5
A C R F _ E C O L I   :   R P I F A W V L A I I L M M A G A L A I L Q L P V   :   2 5
M E X B _ P S E A E   :   R P I F A W V I A L V I M L A G G L S I L S L P V   :   2 5
O 0 6 4 7 1 | 1 0     :   R P I F A G V L S V I I L L G G V I A M F L L P I   :   2 5
O 2 5 3 2 8 | 8       :   R P I T T L M F A L A I V F F G T M G F K K L S V   :   2 5
O 3 1 1 0 0 | 8       :   R P I F A W V L A I V A M L A G A L S L A K M P I   :   2 5
O 5 2 2 4 8 | 8       :   R P I F A W V I A L V I M L V G A L S I L K L P I   :   2 5
O 6 6 9 7 7 | 8       :   R P V T A F M L M L S F V F L G L Y S L K L V P I   :   2 5
O 6 8 9 6 2 | 8       :   R P I T T L M F A L A I V F F G T M G F K K L S V   :   2 5
O 8 7 9 3 6 | 8       :   R P V F A W V I S L F I M L G G I F A I R A L P V   :   2 5
P 7 3 9 9 8 | 9       :   R P V F S S V C A I I I L L V G T I S I F S L P I   :   2 5
P 9 5 4 2 2 | 1 0     :   R P I F A A V L S L L I L I G G A I S L F Q L P I   :   2 5
Q 5 1 0 7 3 | 8       :   R P I F A W V I S I F I I A A G I F G I K S L P V   :   2 5
Q 5 1 3 9 6 | 8       :   R P N F A W V V A L F I S L G G L L V I S K L P V   :   2 5
Q 5 5 5 8 4 | 1 2     :   N P V L T T V C T I V I I L L G A I A L P L L P L   :   2 5
Y 8 9 5 _ H A E I N   :   R P V L A V S I S L L M I I L G L Q A I S K L A V   :   2 5
Y E G N _ E C O L I   :   R P V A T T L L M V A I L L A G I I G Y R A L P V   :   2 5
Y E G O _ E C O L I   :   R P V A T I L L S V A I T L C G I L G F R M L P V   :   2 5
Y H I V _ E C O L I   :   R P V F A W V L A I I M M L A G G L A I M N L P V   :   2 5
                          R P   f a   v         i   l   G             L P v          
Слева вы видите выравнивание блока PR00702A.
Красным цветом отображены колонки, степень консервативности которых больше 80%;
жёлтым — , степень консервативности которых от 60% до 80%;
а зелёным — , степень консервативности которых от 40% до 60%.
Все остальные — колонки, степень консервативности которых меньше 40%.

Веса аминокислотных замен

Вычисление весов аминокислотных замен на основе множественного выравнивания блока PR00702A из базы данных BLOCKS:

Пара аминокислот nαβ pαβ qα qβ sαβ
W и W 19 0,004720497 0,017142857 0,017142857 8
W и F 10 0,002484472 0,017142857 0,06310559 0
W и P 0 - - - -
С помощью программы pairs_count.exe были посчитаны количества всех возможных пар аминокислот (nαβ)(далее работа в Excel) и суммарное количество пар (N=4025) . Потом были посчитаны доли каждой пары аминокислот по отношению к их общему количеству (pαβ=nαβ/N), частоты их встречаемости qα=pαα+(pαβ+pαγ+...)/2 и вычислины веса аминокислотных замен sαβ=2log2(pαβ/(2*qα*qβ)). Прочерки в графе "W и P" означают, что пролина в этом блоке нет.

Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS:

Пара аминокислот nαβ pαβ qα qβ sαβ
W и W 839813 0,00366461 0,010667038 0,010667038 10
W и F 234857 0,001024823 0,010667038 0,046575773 0
W и P 62444 0,000272481 0,010667038 0,034994408 -4
Вычисления и обозначения примерно такие же как и предыдущем случае, разве что N=229168446

Сравнение весов аминокислотных замен:

Из данной таблицы видно, что веса аминокислотных замен,полученные на основе 200 блоков, весьма схожи с данными из BLOSSOM62 (отличие небольше 1);тогда как в блоке PR00702A аминокислотная замена триптофана на триптофан меньше на 3. Это объясняется размером выборки: данные, полученные из 200 блоков, дают более общие результаты (а следовательно близкие к BLOSSOM62),чем из блока PR00702A.
Различие данных по вертикали обусловлено природой замены. Так, например, замена аминокислоты саму на себя (триптофан) имеет наибольший вес замены, а вес замены пары менее родственных аминокислот (триптофан и фенилалалнин) около 1. Отрицательные значения в графе "W и P" означают, что такая замена биологически не выгодна. А прочерк в той же графе - что пролина в блоке PR00702A и вовсе нет.
Пара аминокислот Блок PR00702A 200 блоков BLOSUM62
W и W 8 10 11
W и F 0 0 1
W и P - -4 -4

© Яковлев Сергей,2005