Мембранные белки

Белок-прототип: PDB-1OKC, SwissProt-P02722. Исследуемый белок: UniProt-Q800B6 Данные белки являются АДФ/АТФ транслоказами во внутренней мембране митохондрий. Первая последовательность из быка Bos taurus, вторая — из лягушки RANA RUGOSA

Построение парного выравнивания исследуемого белка и заданного прототипа

Последовательности совпали за исключением первого аминокислотного остатка: в PDB-файле отсутствует метионин.
Поэтому произошёл сдвиг и в нумерации атомов, то есть каждому атому нужно прибавлять по 1. Выравнивание с помощью программы needle:
1OKC               1 -SDQALSFLKDFLAGGVAAAISKTAVAPIERVKLLLQVQHASKQISAEKQ     49
                      |||||||||||||||||||||||||||||||||||||||||||||||||
P02722             1 MSDQALSFLKDFLAGGVAAAISKTAVAPIERVKLLLQVQHASKQISAEKQ     50

1OKC              50 YKGIIDCVVRIPKEQGFLSFWRGNLANVIRYFPTQALNFAFKDKYKQIFL     99
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
P02722            51 YKGIIDCVVRIPKEQGFLSFWRGNLANVIRYFPTQALNFAFKDKYKQIFL    100

1OKC             100 GGVDRHKQFWRYFAGNLASGGAAGATSLCFVYPLDFARTRLAADVGKGAA    149
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
P02722           101 GGVDRHKQFWRYFAGNLASGGAAGATSLCFVYPLDFARTRLAADVGKGAA    150

1OKC             150 QREFTGLGNCITKIFKSDGLRGLYQGFNVSVQGIIIYRAAYFGVYDTAKG    199
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
P02722           151 QREFTGLGNCITKIFKSDGLRGLYQGFNVSVQGIIIYRAAYFGVYDTAKG    200

1OKC             200 MLPDPKNVHIIVSWMIAQTVTAVAGLVSYPFDTVRRRMMMQSGRKGADIM    249
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
P02722           201 MLPDPKNVHIIVSWMIAQTVTAVAGLVSYPFDTVRRRMMMQSGRKGADIM    250

1OKC             250 YTGTVDCWRKIAKDEGPKAFFKGAWSNVLRGMGGAFVLVLYDEIKKFV    297
                     ||||||||||||||||||||||||||||||||||||||||||||||||
P02722           251 YTGTVDCWRKIAKDEGPKAFFKGAWSNVLRGMGGAFVLVLYDEIKKFV    298
Ниже приведено выравнивание PDB-последовательности заданного белка и последовательности из UniProt исследуемого белка. Это выравнивание мы будем расматривать в качестве эталонного, так как при таком высоком проценте идентчиности (85%) пространственные структуры белков, а значит и трансмембранные участки с высокой вероятностью совападут на 100%.
                                                                                                                                                                                                           
                                    *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                          
1 O K C       :   S D Q A L S F L K D F L A G G V A A A I S K T A V A P I E R V K L L L Q V Q H A S K Q I S A E K Q Y K G I I D C V V R I P K E Q G F L S F W R G N L A N V I R Y F P T Q A L N   :     8 7
Q 8 0 0 B 6   :   - - - - - - - A K D F L A G G V A A A I S K T A V A P I E R V K L L L Q V Q H A S K Q I T A D K Q Y K G I M D C V V R I P K E Q G F V S F W R G N L A N V I R Y F P T Q A L N   :     8 0
                  * * * * * * *   K D F L A G G V A A A I S K T A V A P I E R V K L L L Q V Q H A S K Q I 3 A   K Q Y K G I 6 D C V V R I P K E Q G F 6 S F W R G N L A N V I R Y F P T Q A L N            
                                                                                                                                                                                                           
                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                   *                    
1 O K C       :   F A F K D K Y K Q I F L G G V D R H K Q F W R Y F A G N L A S G G A A G A T S L C F V Y P L D F A R T R L A A D V G K G A A Q R E F T G L G N C I T K I F K S D G L R G L Y Q   :   1 7 4
Q 8 0 0 B 6   :   F A F K D K Y K K I F L D N V D K R T Q F W R Y F A G N L A S G G A A G A T S L C F V Y P L D F A R T R L A A D V G K A G A D R E F K G L G D C L A K I F R S D G L K G L Y Q   :   1 6 7
                  F A F K D K Y K   I F L     V D 4     Q F W R Y F A G N L A S G G A A G A T S L C F V Y P L D F A R T R L A A D V G K     A   R E F   G L G 1 C 6   K I F 4 S D G L 4 G L Y Q            
                                                                                                                                                                                                           
                        1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                   *               2 6 0              
1 O K C       :   G F N V S V Q G I I I Y R A A Y F G V Y D T A K G M L P D P K N V H I I V S W M I A Q T V T A V A G L V S Y P F D T V R R R M M M Q S G R K G A D I M Y T G T V D C W R K I A   :   2 6 1
Q 8 0 0 B 6   :   G F N V S V Q G I I I Y R A A Y F G I Y D T A K G M L P D P K N T H I F I S W M I A Q S V T A V A G F A S Y P F D T V R R R M M M Q S G R K G A E I M Y S G T I D C W K K I A   :   2 5 4
                  G F N V S V Q G I I I Y R A A Y F G 6 Y D T A K G M L P D P K N   H I   6 S W M I A Q 3 V T A V A G     S Y P F D T V R R R M M M Q S G R K G A   I M Y 3 G T 6 D C W 4 K I A            
                                                                                                     
                                  *               2 8 0                   *                          
1 O K C       :   K D E G P K A F F K G A W S N V L R G M G G A F V L V L Y D E I K K F V   :   2 9 7
Q 8 0 0 B 6   :   R D E G S R A F F K G A W S N V L R G M G G A F V L V L Y D E L K K Y I   :   2 9 0
                  4 D E G   4 A F F K G A W S N V L R G M G G A F V L V L Y D E 6 K K 5 6            

Разметка мембранных сегментов по данным OPM
На картинке Jmol видно, что N-конец находится в матриксе митохондрии.
Всего в белке 6 трансмембранных участков. Разметку можно увидеть на картинке после третего задания.

Разметка мембранных сегментов по данным TMHMM
Страничка с результатом предсказания находится здесь:
                                                                                                                                                                                                           
                                    *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                          
1 O K C       :   S D Q A L S F L K D F L A G G V A A A I S K T A V A P I E R V K L L L Q V Q H A S K Q I S A E K Q Y K G I I D C V V R I P K E Q G F L S F W R G N L A N V I R Y F P T Q A L N   :     8 7
Q 8 0 0 B 6   :   - - - - - - - A K D F L A G G V A A A I S K T A V A P I E R V K L L L Q V Q H A S K Q I T A D K Q Y K G I M D C V V R I P K E Q G F V S F W R G N L A N V I R Y F P T Q A L N   :     8 0
O P M         :   + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H   :     3 8
T M H M M     :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                   *                    
1 O K C       :   F A F K D K Y K Q I F L G G V D R H K Q F W R Y F A G N L A S G G A A G A T S L C F V Y P L D F A R T R L A A D V G K G A A Q R E F T G L G N C I T K I F K S D G L R G L Y Q   :   1 7 4
Q 8 0 0 B 6   :   F A F K D K Y K K I F L D N V D K R T Q F W R Y F A G N L A S G G A A G A T S L C F V Y P L D F A R T R L A A D V G K A G A D R E F K G L G D C L A K I F R S D G L K G L Y Q   :   1 6 7
O P M         :   H H H H + + + + + + + + + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H   :     7 2
T M H M M     :   - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + H H H H   :     2 7
                                                                                                                                                                                                           
                                                                                                                                                                                                           
                        1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                   *               2 6 0              
1 O K C       :   G F N V S V Q G I I I Y R A A Y F G V Y D T A K G M L P D P K N V H I I V S W M I A Q T V T A V A G L V S Y P F D T V R R R M M M Q S G R K G A D I M Y T G T V D C W R K I A   :   2 6 1
Q 8 0 0 B 6   :   G F N V S V Q G I I I Y R A A Y F G I Y D T A K G M L P D P K N T H I F I S W M I A Q S V T A V A G F A S Y P F D T V R R R M M M Q S G R K G A E I M Y S G T I D C W K K I A   :   2 5 4
O P M         :   H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - -   :   1 2 1
T M H M M     :   H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +   :     6 9
                                                                                                                                                                                                           
                                                                                                     
                                  *               2 8 0                   *                          
1 O K C       :   K D E G P K A F F K G A W S N V L R G M G G A F V L V L Y D E I K K F V   :   2 9 7
Q 8 0 0 B 6   :   R D E G S R A F F K G A W S N V L R G M G G A F V L V L Y D E L K K Y I   :   2 9 0
O P M         :   - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H H + + + + +   :   1 4 5
T M H M M     :   + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +   :       -
                                                                                                     
Результаты предсказания TMHMM для исследуемого белка

  Число а.к. остатков
Всего а.к. остатков 290
Остатки, предсказанные как локализованные в мембране (всего, TM) 69
Правильно предсказали (true positives, TP) 65
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 4
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 141
  Правильно не предсказали ТМ и правильно указали ориентацию относительно мембраны 44
  Правильно не предсказали, но неправильно указали ориентацию относительно мембраны 97
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 80
Чувствительность (sensivity) = TP / (TP+FN) 0.448
Специфичность (specificity) =  TN / (TN+FP)  0.972
Точность (precision) = TP / (TP+FP)                        0.942
Сверхпредсказание = FP/ (FP+TP)      0.058
Недопредсказание = FN / (TN+FN)                                            0.361
На главную страницу семестра


©Goryanin Ignat 2005