Поиск последовательностей белка-прототипа в БД PDB и БД UniProt.
На сайте банка PDB по ID 1okc был найден нужный белок.
Его последовательность скачана по ссылке FASTA Sequence(файл).
Для поиска белка в БД UniProt я использовала SRS(файл).
Их сравнение в (файле)
Характеристики выравнивания:
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 298
# Identity: 297/298 (99.7%)
# Similarity: 297/298 (99.7%)
# Gaps: 1/298 ( 0.3%)
# Score: 1542.0
Последовательности отличаются по одному аминокислотному остатку: в записи PDB отсутствует первый метионин.
По идентификатору UniProt (Q5KSP4)получена последовательность заданного белка(файл).
Программой needle построено парное выравнивание этой последовательности и
последовательности белка-прототипа из PDB(файл).
Характеристики выравнивания:
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 298
# Identity: 263/298 (88.3%)
# Similarity: 281/298 (94.3%)
# Gaps: 1/298 ( 0.3%)
# Score: 1397.0
Это выравнивание импортировано в GeneDoc и сохраните в файле под названием marking.msf
По ID 1OKC PDB белка-прототипа было найдено описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database). В соответствии с этим в программе GeneDoc к парному выравниванию заданного белка и прототипа была добавлена еще одна строка-"последовательность", где символами "H" обозначили позиции аминокислот мембранных сегментов,"+" - позиции цитоплазматических петель, "-" - остальные. Результат в файле файл.
Топология заданного белка предсказана с помощью сервера TMHMM(опции по умолчанию). Результат.
В программе GeneDoc к выравниванию была добавлена четвертая "последовательность",
где на основании предсказания TMHMM символами "H" обозначили позиции аминокислот мембранных сегментов,
"+" - позиции цитоплазматических петель, "-" - позиции вне клетки. Результат.
В выравнивании желтым - выровненные последовательности белков, зеленым - позиции мембранных аминокислот,
одинаково предсказанные обоими описанными выше способами. Это же выравнивание в виде текстового файла формата
Clustal.
Сервисом TMHMM структуры были определены с высокой точностью, однако чувствительность метода в данном случае
низкая, так как было предсказано всего 2 мембранные стуктуры из 6,определенных OPM.
Результаты предсказания топологии мембранного белка Q5KSP4:
Число а.к. остатков | |
Всего а.к. остатков | 298 |
Остатки, предсказанные как локализованные в мембране (всего) | 46 |
Правильно предсказали (true positives, TP) | 43 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 3 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 10 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 103 |
Чувствительность (sensivity) = TP / (TP+FN) | 0.29 |
Специфичность (specificity) = TN / (TN+FP) | 0.76 |
Точность (precision) = TP /(TP+FP) | 0.93 |
Сверхпредсказание = FP/ (FP+TP) | 0.06 |
Недопредсказание = FN /(TN+FN) | 0.91 |
Сервис TMHMM предсказал только 2 мембранные стуктуры из 6,определенных OPM. Показатели Чувствительность-Специфичность-Точность отлично иллюстрируют полученные данные: хотя точность и специфичность велики, чувствительность оставляет желать лучшего. А так же большое недопредсказание - предсказано меньше половины.