Главная страница

Мембранные белки


1.Построение парного выравнивания исследуемого белка и заданного прототипа

Идентификатор белка-прототипа – Q41372, а его PDB-код - 2B5F. Для сравнения последовательностей белка из БД UniProt и PDB было сделано парное глобальное выравнивание с помощью программы needle.
Как можно увидеть, различия в последовательностях присутствуют, а именно - последовательность из БД PDB на 22 аминокислотных остатка длиннее. Эти остатки расположены в конце последовательности и, скорее всего, их присутствие связано с определенными модификациями белка для определения его структуры.

Далее было сделано выравнивание последовательности заданного белка (Q0EEG8) и белка-прототипа (из PDB). Выравнивание также производилось программой needle, но формат файла был изменен для возможности работы в GenDoc.
needle Q0EEG8.fasta 2B5F.fasta msf -aformat3 msf
При помощи функции "Statistics report" GenDoc можно узнать такие характеристики выравнивания, как процент идентичности (74%), сходства (81%), количество гэпов (11%).

2. Разметка мембранных сегментов на выравнивании

На странице БД ОРМ, посвященной данному белку, можно найти данные о его ориентации в мембране. В файл marking.msf была добавлена строка ОРМ, где мембранные участки отмечены как Н; петли, обращенные в цитоплазму - "+"; петли, обращенные во внеклеточное пространство - "-". Совпадающие аминокислотные остатки мембранных участков выделены голубым, несовпадающие - зеленым, совпадающие остатки цитоплазматических участков - оранжевым, несовпадающие - желтым, совпадающие остатки участков, обращенных во внеклеточное пространство - красным, несовпадающие - розовым.

3. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)

По результатам предсказания в файл marking.msf была добавлена еще одна строка (TMHMM), обозначения использовались те же, что и в ОРМ.
Страница результатов
Полученное выравнивание:
                                                                                                                                                                                                           
                                            *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                  
Q 0 E E G 8 _ T A X   :   - - - - - - - - - - V E Q Q G I G A K D Y I D P P P A P L V D F E E F K L W S F Y R A L I A E F I A T L L F L Y I T I A T V I G H K R T A A N C G S V G I L G I A W A   :     7 3
2 B 5 F               :   M S K E V S E E A Q A H Q H G - - - K D Y V D P P P A P F F D L G E L K L W S F W R A A I A E F I A T L L F L Y I T V A T V I G H S K E T V V C G S V G L L G I A W A   :     8 0
O P M                 :   + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - H H H H H H   :     2 8
T M H M M             :   ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + H H H H H H H H   :     3 1
                                                                                                  * * *                                                                       * * *                        
                                                                                                                                                                                                           
                                      *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1 6 0                        
Q 0 E E G 8 _ T A X   :   F G G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L P R A V L Y M V A Q C L G A I C G V G L V K A F Q K S F Y D M H G G G A N S V A Q G Y S K G T   :   1 5 6
2 B 5 F               :   F G G M I F V L V Y C T A G I S G G H I N P A V T F G L F L A R K V S L L R A L V Y M I A Q C L G A I C G V G L V K A F M K G P Y N Q F G G G A N S V A L G Y N K G T   :   1 6 3
O P M                 :   H H H H H H H H H H H H H + + + + + + + + H H H H H H H H H H - - - - H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + + + + + + +   :     7 3
T M H M M             :   H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + H H H H H H   :     7 5
                                              * * *           * * *               * * *   * * *                                       * * *                                               * * *            
                                                                                                                                                                                                           
                                *               1 8 0                   *               2 0 0                   *               2 2 0                   *               2 4 0                              
Q 0 E E G 8 _ T A X   :   G L G A E I I G T F V L V Y T V F S A T D P K R S A R D S H V P V L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I Y G H D K I W D D Q W I F W   :   2 3 9
2 B 5 F               :   A L G A E I I G T F V L V Y T V F S A T D P K R S A R D S H V P I L A P L P I G F A V F M V H L A T I P I T G T G I N P A R S F G A A V I F N S N K V W D D Q W I F W   :   2 4 6
O P M                 :   H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H + + + + + + + + H H H H H H H H H H - - - - - - - - - H H H H H   :   1 2 3
T M H M M             :   H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + + + + H H H H   :   1 1 9
                                                          * * *                           * * *                           * * *           * * *               * * *     *       * * *                      
                                                                                                                                                       
                          *               2 6 0                   *               2 8 0                   *               3 0 0                        
Q 0 E E G 8 _ T A X   :   V G P F L G A F A A A F Y H Q Y I L R A A A I K A L G S F R S N P - N V - - - - - - - - - - - - - - - - - - - - -   :   2 7 4
2 B 5 F               :   V G P F I G A A V A A A Y H Q Y V L R A A A I K A L G S F R S N P T N L E Q K L I S E E D L N S A V D H H H H H H   :   3 0 3
O P M                 :   H H H H H H H H H H H H H H H + + + + + + + + + + + + + + + + + - - - - - - - - - - - - - - - - - - - - - - - - -   :   1 3 8
T M H M M             :   H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :   1 3 8
                                                  * * *                                                                                                


Выравнивание в формате Clustal
4. Оценка качества предсказания

  Число а.к. остатков
Всего а.к. остатков 274
Остатки, предсказанные как локализованные в мембране (всего) 138
Правильно предсказали (true positives, TP) 113
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 25
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 111
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 25
Чувствительность (sensivity) = TP / (TP+FN) 0,82
Специфичность (specificity) =  TN / (TN+FP)  0,81
Точность (precision) = TP / (TP+FP)                        0,81
Сверхпредсказание = FP/ (FP+TP)      0,18
Недопредсказание = FN / (TN+FN)                                            0,18


Следует отметить высокие значения чувствительности, специфичности и точности. С другой стороны, несмотря на совпадение позиций, в которых находятся отдельные аминокислотные остатки трансмембранных фрагментов, количество фрагментов не совпадает - 6 вместо 8 по ОРМ, два фрагмента вообще не указано (третий и седьмой). Также во многих случаях различается указание положения фрагментов, соединяющих мембранные участки (в цитоплазме или во внутриклеточной среде).
Следует также иметь в виду, что предсказание ТМНММ велось для заданного белка, а данные ОРМ взяты для прототипа. Различия между белками не являются большими, но все же присутствуют, и поэтому отличия в предсказании от данных ОРМ в определенной мере могут являться не фактической неточностью, а отражением различия структур белков.


©Сорочкина Александра