Четвертый семестр

Мембранные белки

Задание - предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.


Белок для исследования
Белок-прототип
AC UniProt
AC UniProt
PDB ID
Q6L372
P83791 1VF5, цепь A
цитохром b6 (Saccharum hybrid cultivar)
цитохром b6 (Mastigocladus laminosus)

С помощью SRS была получена последовательность белка-прототипа из БД UniProt (запрос [uniprot-AccNumber:P83791*]) . В БД PDB командой Download Files (FASTA Sequence) был получена FASTA-последовательность этого белка. Из него была вырезана последовательность для цепи А. Для заданного белка была аналогично получена последовательность из БД UniProt.
  1. Построение парного выравнивания исследуемого белка и заданного прототипа.

    Так как последовательности из БД PDB и БД UniProt могут различаться, то сначала были сравнены две найденные последовательности белка-прототипа. Было построено попарное выравнивание. Последовательности полностью совпадают.

    Затем были попарно выравнены последовательности белка-прототипа и заданного белка. ID составило 76%. Снижение идентичности произошло из-за различия в длине последовательностей (215 и 234 а.о.) - вначале последовательности-прототипа стоит 29 гэпов. Готовое выравнивание было импортировано в GeneDoc и сохранено в файле marking.msf.

  2. Разметка мембранных сегментов на выравнивании.

    В БД OPM было найдено описание расположения белка-прототипа в мембране (он расположен в мембране тилакоида). Для цепи А описано
    4 трансмембранных сегмента: 33-53, 88-109, 115-134, 185-205 (указаны позиции а.о. в последовательности).
    С помощью Jmol были определено расположение цитоплазматических цепей. Опция Hide позволяет оставить на изображении только цепь А. Номера аминокислотных остатков определяются автоматически нажатием мышки. Таким образом были определены следующие положения для
    цитоплазматичеких петлей:1-32, 110-114, 206-215.
    В файле marking.msf ниже последовательности прототипа была добавлена последовательность с названием "OPM" и разметкой TM сегментов.

  3. Предсказание топологии заданного белка с помощью программы TMHMM..

    Программа TMHMM для исследуемого белка предсказала следующее расположение в мембране - см. результаты.

    Цитоплазматические петли предсказаны как inside, трансмембранные участки - TMhelix. В выравнивание была добавлена искусственная последовательность TMHMM, отражающая полученные данные .

    Полученное выравнивание:

                                                                                                                                                                                                                                                                 
                                                *                 2 0                   *                 4 0                   *                 6 0                   *                 8 0                   *               1 0 0                            
    Q 6 L 3 7 2           :   M S M K F S Y T V L G G G V G L V T Y L N K V Y D W F E E R L E I Q A I A D D I T S K Y V P P H V N I F Y C L G G I T L T C F L V Q V A T G F A M T F Y Y R P T V T E A F S S V Q Y I M T E A N F G W L I R S V H R W S   :   1 0 8
    1 V F 5 _ A           :   - - - - - - - - - - - - - - - - - - - M A N V Y D W F Q E R L E I Q A L A D D V T S K Y V P P H V N I F Y C L G G I T L T C F L I Q F A T G F A M T F Y Y K P T V T E A Y A S V Q Y I M N E V S F G W L I R S I H R W S   :     8 9
    O M P                 :   - - - - - - - - - - - - - - - - - - - + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H   :     2 3
    T M H M M             :   + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H   :     2 9
                                                                                                                                                                                                                                              h                  
                                                                                                                                                                                                                                                                 
                                *               1 2 0                   *               1 4 0                   *               1 6 0                   *               1 8 0                   *               2 0 0                   *                        
    Q 6 L 3 7 2           :   A S M M V L M M I L H V F R V Y L T G G F K K P R E L T W V T G V V L A V L T A S F G V T G Y S L P W D Q I G Y W A V K I V T G V P E A I P V I G S P L V E L L R G S A S V G Q S T L T R F Y S L H T F V L P L L T A V   :   2 1 6
    1 V F 5 _ A           :   A S M M V L M M I L H V F R V Y L T G G F K K P R E L T W I S G V I L A V I T V S F G V T G Y S L P W D Q V G Y W A V K I V S G V P E A I P V V G V L I S D L L R G G S S V G Q A T L T R Y Y S A H T F V L P W L I A V   :   1 9 7
    O M P                 :   H H H H H H H H H H H H H H H H H H H H + + + + + H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H   :     7 6
    T M H M M             :   H H H H H H H H H H H H H H H H H + + + + + + + + + + + H H H H H H H H H H H H H H H H H H H H H H H - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - H H H H H H H H H H H H H H   :     8 3
                                                  H                                                                                                                                                                             H                                
                                                                             
                                2 2 0                   *                    
    Q 6 L 3 7 2           :   F M L M H F P M I R K Q G I S G P L   :   2 3 4
    1 V F 5 _ A           :   F M L L H F L M I R K Q G I S G P L   :   2 1 5
    O M P                 :   H H H H H H H H + + + + + + + + + +   :     8 4
    T M H M M             :   H H H H H H H H H + + + + + + + + +   :     9 2
                                      H                                      
    Серым цветом обозначены выравненные участки заданной последовательности и последовательности прототипа, Зеленым - тм участки, красным - цитоплазматические цепи.
    Выравнивание было экспортировано в файл формата Clustal.

  4. Оценка качества предсказания
  5. Для определения качества предсказания не рассматривалась та часть последовательности, которой в выравнивании соответствуют гэпы в последовательности белка-прототипа.

    Результаты предсказания топологии мембранного заданного белка

      Число а.к. остатков
    Всего а.к. остатков 234 а.о.
    Остатки, предсказанные как локализованные в мембране (всего) 92
    Правильно предсказали (true positives, TP) 78
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 14
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 142
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 6
    Чувствительность (sensivity) = TP / (TP+FN) 92,9%
    Специфичность (specificity) =  TN / (TN+FP)  91%
    Точность (precision) = TP / (TP+FP)                        84,8%
    Сверхпредсказание = FP/ (FP+TP)      15,2%
    Недопредсказание = FN / (TN+FN)                                            4%

    Можно сделать вывод, что программа ТМНММ имеет высокое качество предсказания. Точность алгоритма также очень высокая = 85%, а недопредсказание также оказывается очень низким - 4%, так как довольно хорошо определяется принадлежность каждого участка последовательности к определенному сегменту трансмембранного белка. Можно отметить, что для программы свойственно удлинение предсказываемых трансмембранных сегментов, и их редкий пропуск.


©Nechay Olesya 2005