Первая последовательность (исследуемая) 1.fasta
Вторая последовательность (из PDB) 2.fasta
Выравнивание было построено с помошью программы needle.
Параметры выравнивания:
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 1045
# Identity: 840/1045 (80.4%)
# Similarity: 934/1045 (89.4%)
# Gaps: 45/1045 ( 4.3%)
# Score: 4389.0
Полученное выравнивание marking.msf
По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране
в БД OPM
(Orientations of Proteins in Membranes database)
На выравнивании отметили указанные трансмембранные участки.
1(57-76), 2(87-105), 3(260-274), 4(288-306), 5(762-781), 6(789-806), 7(834-853), 8(897-915), 9(931-949), 10(966-987)
Предсказали топологию заданного белка с помощью
сервера TMHMM..
Результаты поиска представлены на странице TMHMM result
К последовательностям в файле marking.msf еще одну искусственную
последовательность, отражающую результаты данного предсказания.
Готовое выравнивание Shalaeva.htm
В формате Clustal Shalaeva.aln
Результаты предсказания топологии мембранного белка
| Число а.к. остатков | |
| Всего а.к. остатков | 1000 |
| Остатки, предсказанные как локализованные в мембране (всего) | 172 |
| Правильно предсказали (true positives, TP) | 118 |
| Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 33 |
| Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 630 |
| Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 75 |
| Чувствительность (sensivity) = TP / (TP+FN) | 0.611 (61.1%) |
| Специфичность (specificity) = TN / (TN+FP) | 0.95 (95%) |
| Точность (precision) = TP /(TP+FP) | 0.781 (78.1%) |
| Сверхпредсказание = FP/ (FP+TP) | 0.218 (21.8%) |
| Недопредсказание = FN /(TN+FN) | 0.106 (10.6%) |
Таким образом, программой TMHMM былпредсказан один трансмембранный участок, который сравнивать не с чем, поскольку соответствующего фрагмента в белке-прототипе нет, два трансмембранных участка, указанных для прототипа найдены не были. В то же время остальные найденные участки хорошо пререкрываются с предсказанными, по этому у данного метода достаточно неплохие показатели - высокие специфичность и точность, небольшое недопредсказание.