Транспортные белки.

1. Построение парного выравнивания исследуемого белка и заданного прототипа.

Выравнивание, полученное программой GeneDoc, показало, что последовательность из UniProt длиннее на 7 аминокислот, и кроме того, последняя аминокислота последовательности из PDB отличается от соответствующей из БД UniProt.

По идентификатору UniProt получили последовательность для Q4VA67. Построили парное выравнивание этой последовательности и последовательности белка-прототипа из PDB при помощи программы needle.

Характеристики:
Aligned_sequences: 2
# 1: Q4VA67_XENTR
# 2: 1SU4_A
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 994
# Identity: 888/994 (89.3%)
# Similarity: 964/994 (97.0%)
# Gaps: 0/994 ( 0.0%)
# Score: 4676.0

Импортировали в GeneDoс, выходной файл - marking.msf

2. Разметка мембранных сегментов на выравнивании.

По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database)

В файле marking.msf ниже последовательности прототипа добавили последовательность с названием "OPM" и разметкой ТМ сегментов (см здесь).

3. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM).

C помощью сервера TMHMM была предсказана топология заданного белка (опции по умолчанию).

Добавили к последовательностям в файле marking.msf еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назвали "TMHMM". Готовое выравнивание экспортировали в формате HTML, а также сохранили его в в виде текстового файла формата Clustal.

4. Оценка качества предсказания.

Результаты предсказания топологии мембранного белка Q4VA67

  Число а.к. остатков
Всего а.к. остатков 994
Остатки, предсказанные как локализованные в мембране (всего) 174
Правильно предсказали (true positives, TP) 136
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 35
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 765
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 55
Чувствительность (sensivity) = TP / (TP+FN) 0.71
Специфичность (specificity) =  TN / (TN+FP)  0.96
Точность (precision) = TP / (TP+FP)                        0.80
Сверхпредсказание = FP/ (FP+TP)      0.20
Недопредсказание = FN / (TN+FN)                       0.07

Сервис TMHMM не обнаружил 2 трансмембранных участка, показанных на прототипе OPM, в результате чего в последовательности прототипа внутриклеточные участки были перепутаны с внеклеточными.
Как показывают подсчеты, чувствительность, специфичность и точность предсказания топологии мембранного белка Q4VA67 довольно высоки, а сверхпредсказание и недопредсказание - низки, что позволяет нам сделать вывод о хорошем качестве предсказания.