Транспортные белки

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. AC Uniprot заданного белка и белка-прототипа: Q640N8 и Q6J8I9 соответсвтенно. В БД Uniprot белок-прототип имеет последовательность:
    >uniprot|Q6J8I9|MIP_SHEEP Lens fiber major intrinsic protein;
    MWELRSASFWRAIFAEFFATLFYVFFGLGASLRWAPGPLHVLQVALAFGLALATLVQAVG
    HISGAHVNPAVTFAFLVGSQMSLLRAICYVVAQLLGAVAGAAVLYSVTPPAVRGNLALNT
    LHPGVSVGQATIVEIFLTLQFVLCIFATYDERRNGRLGSVALAVGFSLTLGHLFGMYYTG
    AGMNPARSFAPAILTRNFTNHWVYWVGPVIGAGLGSLLYDFLLFPRLKSVSERLSILKGT
    RPSESNGQPEVTGEPVELKTQAL
    
    Процедура получения последовательности белка-прототипа из PDB: В строку поиска вводим PDB ID, затем сохраняем fasta-последовательность найденного белка (FASTA Sequence на панели слева).
    Полученная последовательность выглядит следующим образом:
    >1SOR:A|PDBID|CHAIN|SEQUENCE
    RSASFWRAIFAEFFATLFYVFFGLGASLRWAPGPLHVLQVALAFGLALATLVQAVGHISG
    AHVNPAVTFAFLVGSQMSLLRAICYVVAQLLGAVAGAAVLYSVTPPAVRGNLALNTLHPG
    VSVGQATIVEIFLTLQFVLCIFATYDERRNGRLGSVALAVGFSLTLGHLFGMYYTGAGMN
    PARSFAPAILTRNFTNHWVYWVGPVIGAGLGSLLYDFLLFPRLKSVSERLSILKG 
    
    Сравним обе последоваттельности белка-прототипа, выравнив их с помощью программы needle.
    Характеристика построенного выравнивания:
    Gap_penalty: 10.0            
    Extend_penalty: 0.5          
                                 
    Length: 263                  
    Identity:     235/263 (89.4%)
    Similarity:   235/263 (89.4%)
    Gaps:          28/263 (10.6%)
    Score: 1199.0
    
    Построим парное выравнивание последовательности заданного белка (Uniprot AC: Q640N8) и белка-прототипа (PDB ID: 1SOR) с помощью программы needle.
    Характеристика построенного выравнивания:
    Gap_penalty: 10.0            
    Extend_penalty: 0.5          
                                 
    Length: 263                  
    Identity:     224/263 (85.2%)
    Similarity:   229/263 (87.1%)
    Gaps:          28/263 (10.6%)
    Score: 1161.0                
    
    Выравнивание в msf-формате: marking.msf

  3. Разметка мембранных сегментов на выравнивании
  4. К выравниванию белка-прототипа и заданного белка добавим строку, где буквой H отражены TM-сегменты (также выделены жёлтым цветом) и знаком "+" отмечены цитоплазматические петли (оранжевые). Красным цветом отмечены абсолютно консервативные позиции:
    Выравнивание c выделенными ТМ-элементами и цитоплазматическими петлями

  5. Предсказание топологии заданного белка с помощью программы TMHMM
  6. Предсказание топологии заданного белка с помощью сервера TMHMM. (опции по умолчанию).
    На приведённом ниже выравнивании оранжевым цветом и знаком "+" отмечены совпадающие цитоплазматические петли, буквой H и жёлтым цветом - совпадающие TM-сегменты. Красным цветом отмечены абсолютно консервативные позиции:
    Выравнивание c выделенными ТМ-элементами и цитоплазматическими петлями
    Clustal-файл: marking.aln

  7. Оценка качества предсказания
  8. Результаты предсказания топологии мембранного белка Uniprot AC: Q640N8

      Число а.к. остатков
    Всего а.к. остатков 263
    Остатки, предсказанные как локализованные в мембране (всего) 222
    Правильно предсказали (true positives, TP) 162
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 23
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 7
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 34
    Чувствительность (sensivity) = TP / (TP+FN) 0,83
    Специфичность (specificity) =  TN / (TN+FP)  0,29
    Точность (precision) = TP / (TP+FP)                        0,88
    Сверхпредсказание = FP/ (FP+TP)      0,12
    Недопредсказание = FN / (TN+FN)                                            0,83

    Из выравнивания белков видно, что длины последовательностей не совпадают, фактически подсчёт предсказаний касался только той области, которая полностью перекрывается с последовательностью белка PDB, поэтому, возможно, при подсчёте снижены какие-либо характеристики предсказания. Также видно, что программа TMHMM не находит короткие ТМ-сегменты, предсказанные программой OPM, из-за чего увеличивается число FP и FN, следовательно, растёт величина сверхпредсказания и недопредсказания (что также можно видеть из таблицы). В целом, программа обладает высокой точностью и чувствительностью, правда, как и высоким уровнем недопредсказания.

    Назад

    На главную


    ©Степанова Вита