Предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.
Заданный белок - белок-насос для потока ионов железа (FIEF_YERE8) из бактериального организма Yersinia enterocolitica serotype O:8 / biotype 1B (strain 8081). Имеет длину 300 а.о.
Белок-прототип - белок-насос для потока ионов железа(FIEF_ECOLI) из Escherichia coli. Имеет длину 300 а.о. Представляет собой мембранный канальный белок, который ответствен за транспорт ионов железа при их избытке.
При нажатии на картинку с выравниванием полседовательности в структуре появляется выравнивание.Нумерация выравниваний не совпадает, правило перевода: PDB=UniProt+7.
Выравнивание преобразованное в fasta-формат было импортировано в GeneDoc и сохранено в файле algn1.msf.
Получив последовательность заданного белка через UniProt, построила ее парное выравнивание с последовательностью из PDB:
needle FIEF_ECOLI.fasta FIEF_YERE8.fasta ECOLI_YERE8.needle -auto
Характеристики выравнивания: процент идентичности 78, процент сходства 90.3
Цветами тут обозначены: оранжевый - трансмембранный домен, фиолетовый - цитоплазматический. Данное выравнивание лежит в файле.
Через сервер TMHMM (опции по умолчанию) получили следующий файл, после обработки данной информации чере GenDoc получили итоговый файл.
Результаты предсказания топологии мембранного белка FIEF_YERE8
Число а.к. остатков | |
Всего а.к. остатков | 300 |
Остатки, предсказанные как локализованные в мембране (всего) | 129 |
Правильно предсказали (true positives, TP) | 94 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 35 |
Правильно не предсказали (не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 158 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 13 |
Чувствительность (sensivity) = TP/(TP+FN) | 0,88 (88%) |
Специфичность (specificity) = TN/(TN+FP) | 0,82 (82%) |
Точность(precision) = TP/(TP+FP) | 0,73 (73%) |
Сверхпредсказание = FP/(FP+TP) | 0,27 (27%) |
Недопредсказание = FN/(TN+FN) | 0,076 (7,6%) |
По данным таблицы предсказание получилось достаточно специфичным (то есть было предсказано крайне мало трансмембранных остатков там, где не нужно, по отношению к общему количеству немембранных остатков), но мало точным (то есть среди всех предсказанных трансмембранных остатков было относительно мало предсказанных остатков, не являющимися трансмембранными (но они всё же были)). Сверхпредсказание, на мой взгляд, оказалось велико. Зато недопредсказание оказалось очень маленьким, а чувствительность предсказания велика (то есть было предсказано много трансмембранных остатков по сравнению с реальным количеством трансмембранных остатков). Все эти факты говорят, что предсказанию можно доверять (хотя и с осторожностью из-за сверхпредсказания).
В выравнивании последовательность белка FIEF_YERE8 содержит 6 трансмембранных доменов, что совпадает с данными полученными через сервер TMHMM. А также правильно предсказание ориентации белка в мембране: все цитоплазматические аминокислоты предсказанные относительно совпадают с цитоплазматическими аминокислотами в выравнивании.