Внимание, последовательности и нумерация остатков в БД PDB и БД UniProt могут различаться. Поэтому получите и сравните обе последовательности белка-прототипа. Процедуру поиска и результат сравнения опишите в протоколе, прикрепите к протоколу страничку с выравниванием.
По идентификатору UniProt получите последовательность заданного белка. Постройте парное выравнивание этой последовательности и последовательности белка-прототипа из PDB. В протоколе укажите, как строили выравнивание, приведите его характеристики. Готовое выравнивание импортируйте в GeneDoc и сохраните в файле под названием marking.msf
По идентификатору PDB белка-прототипа найдите описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database)
В файле marking.msf ниже последовательности прототипа добавьте последовательность с названием "OPM" и разметкой ТМ сегментов, см. подсказки..Предскажите топологию заданного белка с помощью сервера TMHMM. (опции по умолчанию).
Страничку с результатом предсказания прикрепите к протоколу.
Добавьте к последовательностям в файле marking.msf еще одну искусственную последовательность, отражающую результаты данного предсказания. Эту последовательность назовите "TMHMM".
Готовое выравнивание экспортируйте в формате RTF или HTML и внесите в протокол, а также сохраните его в в виде текстового файла формата Clustal и прикрепите к отчету.Сравните полученное предсказание с данными ОРМ. Рассмотрите полученное выравнивание, и заполните таблицу вида:
Результаты предсказания топологии мембранного белка....
Число а.к. остатков | |
Всего а.к. остатков | |
Остатки, предсказанные как локализованные в мембране (всего) | |
Правильно предсказали (true positives, TP) | |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | |
Чувствительность (sensivity) = TP / (TP+FN) | |
Специфичность (specificity) = TN / (TN+FP) | |
Точность (precision) = TP / (TP+FP) | |
Сверхпредсказание = FP/ (FP+TP) | |
Недопредсказание = FN / (TN+FN) |
В кратком резюме оцените качество предсказания.
Ecли Вы справились с обязательными упражнениями, то можете попробовать выполнить дополнительные.
Подсказка: согласно этому правилу петли, обращенные в сторону цитоплазмы, содержат больше остатков аргинина и лизина.
Постройте профиль гидрофобности для аминокислотной
последовательности изучаемого белка (не для прототипа!)
Данные для построения профиля получите с помощью программы
pepwindow пакета EMBOSS (-graph
data). Используйте размер окна в 19 а.о.
Вообще-то программа может выдать и график, но с ним неудобно работать дальше.
По полученным данным постройте профиль гидрофобности с помощью Excel. Определите границы трансмембранных сегментов по графику, см. подсказку, п2. Определите внутренние петли и отметьте их на разметке знаком "+".
Создайте копию файла marking.msf с названием marking2.msf. Замените разметку по TMHMM на разметку по профилю гидрофобности. По описанному выше плану оцените качество предсказания.
К отчету прикрепите как рабочую книгу Excel со всеми данными и графиком, так и выравнивание в 2-х вариантах (см.выше).