Первая последовательность (исследуемая) 1.fasta
Вторая последовательность (из PDB) 2.fasta
Выравнивание было построено с помошью программы needle.
Параметры выравнивания:
# Matrix: EBLOSUM62 # Gap_penalty: 10.0 # Extend_penalty: 0.5 # # Length: 1045 # Identity: 840/1045 (80.4%) # Similarity: 934/1045 (89.4%) # Gaps: 45/1045 ( 4.3%) # Score: 4389.0Полученное выравнивание marking.msf
По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране
в БД OPM
(Orientations of Proteins in Membranes database)
На выравнивании отметили указанные трансмембранные участки.
1(57-76), 2(87-105), 3(260-274), 4(288-306), 5(762-781), 6(789-806), 7(834-853), 8(897-915), 9(931-949), 10(966-987)
Предсказали топологию заданного белка с помощью
сервера TMHMM..
Результаты поиска представлены на странице TMHMM result
К последовательностям в файле marking.msf еще одну искусственную
последовательность, отражающую результаты данного предсказания.
Готовое выравнивание Shalaeva.htm
В формате Clustal Shalaeva.aln
Результаты предсказания топологии мембранного белка
Число а.к. остатков | |
Всего а.к. остатков | 1000 |
Остатки, предсказанные как локализованные в мембране (всего) | 172 |
Правильно предсказали (true positives, TP) | 118 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 33 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 630 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 75 |
Чувствительность (sensivity) = TP / (TP+FN) | 0.611 (61.1%) |
Специфичность (specificity) = TN / (TN+FP) | 0.95 (95%) |
Точность (precision) = TP /(TP+FP) | 0.781 (78.1%) |
Сверхпредсказание = FP/ (FP+TP) | 0.218 (21.8%) |
Недопредсказание = FN /(TN+FN) | 0.106 (10.6%) |
Таким образом, программой TMHMM былпредсказан один трансмембранный участок, который сравнивать не с чем, поскольку соответствующего фрагмента в белке-прототипе нет, два трансмембранных участка, указанных для прототипа найдены не были. В то же время остальные найденные участки хорошо пререкрываются с предсказанными, по этому у данного метода достаточно неплохие показатели - высокие специфичность и точность, небольшое недопредсказание.