Мембранные белки

 

Построение парного выравнивания исследуемого белка и заданного прототипа

Исследовался белок с AC в Uniprot Q06SE1 (это белок цитохрома b6 из зеленой водоросли Stigeoclonium helveticum), в качестве белка-прототипа, для которого известна пространственая структура, использовался белок с AC P83791 (тот же белок, но из цианобактерии Mastigocladus laminosus). PDB-код прототипа - 1VF5, рассматривалась цепь A. Надо отметить, что последовательности из банков Uniprot и PDB полностью совпадают (см. выравнивание), поэтому далее я буду употреблять выражение "последовательность прототипа" без указания источника.   Здесь можно наблюдать выравнивание последоваательностей исследуемого белка и прототипа, как видим, они отличаются на 32 аминокислоты из 215. По данным программы water (параметры по умолчанию), значение Identity равно 85.1% при сходстве (Similarity) в 92.6% (т.е. замены являются преимущественно родственными). В выравнивании нет ни одного гэпа.  

Разметка мембранных сегментов на выравнивании

По идентификатору PDB белка-прототипа найдено описание ориентации белка в мембране в БД OPM. Прототип имеет 4 трансмембранные спирали и встроен в мембрану тилакоида, причем оба конца цепи находятся в цитоплазме. Далее с помощью программы TMHMM была проанализирована последовательность исследуемого белка на предмет предсказания трансмембранных участков. Результат.  

Результаты предсказания топологии мембранного белка CYB6_STIHE

  Число а.к. остатков
Всего а.к. остатков 215
Остатки, предсказанные как локализованные в мембране (всего) 91
Правильно предсказали (true positives, TP) 77
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 14
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 98
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 6
Чувствительность (sensivity) = TP / (TP+FN) 0,93
Специфичность (specificity) =  TN / (TN+FP)  0,88
Точность (precision) = TP / (TP+FP)                        0,85
Сверхпредсказание = FP/ (FP+TP)      0,15
Недопредсказание = FN / (TN+FN)                                            0,05
В чем смысл этих вычислений? Мы считаем, что данные из OPM представляют собой объективную истину и для исследуемого нами белка (учитывая его высокое сходство с прототипом, это можно принять). Поэтому мы можем оценить качество предсказания программы TMHMM, сравнивая его с данными OPM. Это сравнение отражено в следующем выравнивании (также см. выравнивание в формате Clustal здесь). Здесь на строчке OPM отражены данные по прототипу из соответствующей БД. Знаками + отмечены цитоплазматические участки, H - трансмембранные, - - находящиеся внутри тилакоида. На строке HMM в тех же обозначениях показаны предсказания TMHMM. Можно заметить, что они почти совпадают как бы с небольшим (1-3 а.о.) сдвигом друг относительно друга. Ошибки не вызваны различием последовательностей исследуемого белка и прототипа, т.к. встречаются в тех местах, где эти последовательности одинаковы. В целом получилось более характерным перепредсказание.
© Петрова Ирина