Откроем домашнюю страничку БД PDBsum (содержит краткие схематические отображения информации о структуре).
Найдем документ с идентификатором PDB - 2ZW3. Затем подведем курсор к выравниванию последовательности в структуре,
нажмем на картинку
и получим окно с выравниванием последовательности из UniProt и последовательности из PDB.
Сохраним выравнивание в файл-fasta, затем импортируем выравнивание в Genedoc и сохраним как файл.
Нумерация в двух БД совпадает, однако последовательность из PDB оказалась короче, чем из UnipProt (можно предположить, что это N- и С- концевые домены, а также гэп в середине последовательности).
По идентификаторам CXB6_HUMAN и CXB2_HUMAN получим последовательности для выравнивания из UniProt с помощью программы seqret.
Последовательности были выравнены с помощью needle. Получили файл.
Откроем домашнюю страничку БД ОРМ,
по PDB ID найдем описание ТМ-сегментов в белке-прототипе.
Импортируем созданное в упр.1.2 выравнивание в Genedoc (needle 6.fasta 2.fasta -auto -aformat msf pp.msf). Под строчкой с выровненной
последовательностью белка-прототипа поместим строчку с разметкой трансмембранных сегментов. Сохраните все в файле.
Добавим к последовательностям в файле с прошлого задания еще одну искусственную последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания. Эту последовательность назовем "TMHMM". Получили файл.
Результаты предсказания топологии мембранного белка CXB6_HUMAN
Число а.к. остатков |
|
Всего а.к. остатков | 261 |
Остатки, предсказанные как локализованные в мембране (всего) | 92 |
Правильно предсказали (true positives, TP) | 76 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 16 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 156 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 13 |
Чувствительность (sensivity) = TP / (TP+FN) | 85.4% |
Специфичность (specificity) = TN / (TN+FP) | 90.7% |
Точность(precision) = TP /(TP+FP) | 82.6% |
Сверхпредсказание = FP/ (FP+TP) | 17.39% |
Недопредсказание = FN / (TN+FN) | 7.7% |
Как видно из таблицы, довольно большое число предсказанных трансмембранных последовательностей неправильно сверхпредсказание, хотя число сегментов и их относительное расположение друг относительно друга верно. 7.7% трансмембранных последовательностей было пропущено при предсказании. Не смотря на это, мы видим высокую специфичность, чувствительность и точность.