На страницу четвертого семестра

  1.  Были получены последовательности белка-прототипа из БД PDB и БД Uniprot. 
    Последовательность из PDB начинается с 9 остатка вместо 1 и заканчивается 233 (тогда как должна 269). Также в описании
    pdb можно найти сведения о том, что данные остатки не были использованы в эксперименте, то есть закристаллизована последовательность с 9 до 233. Однако, нумерация остатков
    не меняется.

    Выравнивание последовательностей белка-прототипа

  2. Затем была получена последовательность исследуемого белка и выравнена с pdb-последовательностью белка-прототипа. Результаты
  3. ОРМ.

  4. Предсказание топологии заданного белка.

    Предсказание, полученное при помощи сервера ТМНММ относительно исследуемого белка выглядит так:

    Добавив к выравниванию белка-прототипа и исследуемого белка строку с предсказанием ТМНММ, а также строку с данными ОРМ, можно получить выранивание такого вида:

                                                                                                                                                                                                               
                                                *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
    Q 6 6 L N 3 _ C O T   :   M A S E F K K K M F W R A V V A E F L A M I L F I F I S I G S A L G F N F P V S V N G T S A T Q D N V K V S L A F G L S I A T M A Q S V G H I S G A H L N P A V T L G   :     8 3
    A Q P 1 _ H U M A N   :   - - - - - - - - L F W R A V V A E F L A T T L F V F I S I G S A L G F K Y P V G - N N Q T A V Q D N V K V S L A F G L S I A T L A Q S V G H I S G A H L N P A V T L G   :     7 4
    O P M                 :   - - - - - - - - + + H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H + + + + + + + + H H H H H H   :     4 6
    T M H M M             :   + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + +   :     4 6
                                                                                                                                                                                                               
                                                                                                                                                                                                               
                                          *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                        
    Q 6 6 L N 3 _ C O T   :   L L L S C Q I S I F K A L M Y I L A Q C L G A V V A T A I L S G V T S S L P Y N S L G L N A L A K G I N A G Q G L G I E I I A T L Q L V L C V L A T T D R R R N D V T   :   1 6 6
    A Q P 1 _ H U M A N   :   L L L S C Q I S I F R A L M Y I I A Q C V G A I V A T A I L S G I T S S L T G N S L G R N D L A D G V N S G Q G L G I E I I G T L Q L V L C V L A T T D R R R R D L G   :   1 5 7
    O P M                 :   H H H H H + + + + H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H + + + + + + + + +   :     8 9
    T M H M M             :   + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + +   :     9 2
                                                                                                                                                                                                               
                                                                                                                                                                                                               
                                    *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                              
    Q 6 6 L N 3 _ C O T   :   G S A P L A I G L S V A L G H L L A I D Y T G C G I N P A R S F G S A L I A N N F E N H W I F W V G P I I G G A G A A L I Y D F I L A P R S S D L T D R V K V W T S G   :   2 4 9
    A Q P 1 _ H U M A N   :   G S A P L A I G L S V A L G H L L A I D Y T G C G I N P A R S F G S A V I T H N F S N H W I F W V G P F I G G A L A V L I Y D F I L A P - - - - - - - - - - - - - - -   :   2 2 5
    O P M                 :   + + H H H H H H H H H H H H H H H H H - - - - - - - - H H H H H H H - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H + - - - - - - - - - - - - - - - -   :   1 3 5
    T M H M M             :   + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + +   :   1 3 8
                                                                                                                                                                                                               
                                                                                   
                              *               2 6 0                   *            
    Q 6 6 L N 3 _ C O T   :   Q V E E Y D L E G D D M N S R V E M K P K   :   2 7 0
    A Q P 1 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - -   :       -
    O P M                 :   - - - - - - - - - - - - - - - - - - - - -   :       -
    T M H M M             :   + + + + + + + + + + + + + + + + + + + + +   :       -
                                                                                   

     На данном выравнивании буквы Н означают принадлежность остатка к внутримембранному типу, знак "+" определяет остаток, 
    как принадлежащий цитоплазматической петле, а "-" - это все остальные остатки. 
    То же выравнивание в формате Clustal.
  5. Оценка качества предсказания.

    Результаты предсказания топологии мембранного белка Aquaporin-1 Число а.к. остатков
    Всего а.к. остатков 270
    Остатки, предсказанные как локализованные в мембране (всего) 138
    Правильно предсказали (true positives, TP) 110
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 28
    Правильно не предсказали (не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 106
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 25
    Чувствительность (sensivity) = TP / (TP+FN) 81.5%
    Специфичность (specificity) =TN / (TN+FP) 79.1%
    Точность (precision) = TP / (TP+FP) 79.7%
    Сверхпредсказание = FP/ (FP+TP) 20.3%
    Недопредсказание = FN / (TN+FN) 19.1%

    Таким образом, чувствительность и точность достаточно высокие, но на выравнивании наблюдается на 2 трансмембранных участка меньше, оба они вообще не предсказаны. Но также можно заметить, что "ошибки" этого предсказания могут и не быть ошибками в полной мере, так как ОРМ сделано для белка-прототипа, а не для исследуемого белка, что дает возможность отличия этих структур, а следовательно и отличия предсказания от разметки ОРМ.


©Babskaya Evgeniya, 2005