Трансмембранные белки

 
Я получила выравнивание последовательности белка FIEF_Ecoli c PDB ID=3h90
с его приведённой в PDB структурой. Последовательность в PDB-файле короче, но нумерация соблюдена (начинается с 8го а.о).
С помощью программы needle пакета EMBOSS я получила глобальное выравнивание белка FIEF_Ents8 c белком-прототипом FIEF_Ecoli.
ИЗ базы данных OPM я получила информацию о 6 траснмембранных доменах белка FIEF_Ecoli. 
Cервер TMHMM также предсказывает наличие 6 трансмембранных спиралей
Известные данные c предсказанием я соотнесла на выравнивании.

  

Результаты предсказания топологии мембранного белка FIEF_Ecoli

  Число а.к. остатков
Всего а.к. остатков 300
Остатки, предсказанные как локализованные в мембране (всего) 130
Правильно предсказали (true positives, TP) 90
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 40
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 159
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 11
Чувствительность (sensivity) = TP / (TP+FN) 0.891
Специфичность (specificity) =  TN / (TN+FP)  0.799
Точность(precision) = TP /(TP+FP) 0.692
Сверхпредсказание = FP/ (FP+TP) 0.308
Недопредсказание = FN / (TN+FN) 0.065
в виде текстового файла * скрипт на языке perl, с помощью которого получен результат. Скрипт подходит для тех белков, для которых в выравниваниях последовательности и структуры в PDB нет гэпов в середине, а только сдвиги первого атома. Несмотря на то, что предсказано столько же т-м. спиралей, сколько есть на самом деле, пятый из предсказанных доменов совсем не совпадает с истинным, а 5 из 6 предсказанных участков длиннее, чем настоящие. Из-за этого у нас довольно высокое сверхпредсказание, пострадали точность и специфичность. Тем не менее "плюсы" на выравнивании никогда не противолежат "минусам", т.е. ориентация петель предсказана верно. В процессе написания скрипт был опробован на некоторых других трансмембранных белках, включая родопсин (PDB ID=3cap) Выдача указывает на высокие характеристики предсказания в данном случае. То есть TMHMM может давать и весьма точные результаты.


К перечню исследовательских работ
На главную