Выравнивание, полученное программой GeneDoc, показало, что последовательность из UniProt длиннее на 7 аминокислот, и кроме того, последняя
аминокислота последовательности из PDB отличается от соответствующей из БД UniProt.
По идентификатору UniProt получили последовательность для Q4VA67. Построили парное выравнивание этой последовательности и последовательности
белка-прототипа из PDB при помощи программы needle.
Характеристики:
Импортировали в GeneDoс, выходной файл - marking.msf
Aligned_sequences: 2
# 1: Q4VA67_XENTR
# 2: 1SU4_A
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 994
# Identity: 888/994 (89.3%)
# Similarity: 964/994 (97.0%)
# Gaps: 0/994 ( 0.0%)
# Score: 4676.0
2. Разметка мембранных сегментов на выравнивании.
По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране в БД OPM
(Orientations of Proteins in Membranes database)
3. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM).
C помощью сервера TMHMM была предсказана топология заданного белка
(опции по умолчанию).
Добавили к последовательностям в файле marking.msf еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назвали "TMHMM".
Готовое выравнивание экспортировали в формате HTML, а также сохранили его в в виде текстового файла формата Clustal.
4. Оценка качества предсказания.
Результаты предсказания топологии мембранного белка Q4VA67
Сервис TMHMM не обнаружил 2 трансмембранных участка, показанных на прототипе
OPM, в результате чего в последовательности прототипа внутриклеточные участки
были перепутаны с внеклеточными.
Число а.к. остатков
Всего а.к. остатков
994
Остатки, предсказанные как локализованные в мембране (всего)
174
Правильно предсказали (true positives, TP)
136
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)
35
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)
765
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)
55
Чувствительность (sensivity) = TP / (TP+FN)
0.71
Специфичность (specificity) = TN / (TN+FP)
0.96
Точность
(precision) = TP /
(TP+FP)
0.80
Сверхпредсказание = FP/ (FP+TP)
0.20
Недопредсказание
= FN /
(TN+FN)
0.07
Как показывают подсчеты,
чувствительность, специфичность
и точность предсказания топологии мембранного белка Q4VA67 довольно высоки,
а сверхпредсказание и недопредсказание - низки,
что позволяет нам сделать вывод о хорошем качестве предсказания.