Функции, продолжение. Мембранные белки, транспортные белки.

Построение выравнивания заданного белка и белка-прототипа с разметкой трансмембранных сегментов.

  1. Сравнение нумерации остатков белка-прототипа в UniProt и PDB
  2. Откроем домашнюю страничку БД PDBsum (содержит краткие схематические отображения информации о структуре).
    Найдем документ с идентификатором PDB - 2ZW3. Затем подведем курсор к выравниванию последовательности в структуре,
    нажмем на картинку и получим окно с выравниванием последовательности из UniProt и последовательности из PDB.
    Сохраним выравнивание в файл-fasta, затем импортируем выравнивание в Genedoc и сохраним как файл.

    Нумерация в двух БД совпадает, однако последовательность из PDB оказалась короче, чем из UnipProt (можно предположить, что это N- и С- концевые домены, а также гэп в середине последовательности).

  3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
  4. По идентификаторам CXB6_HUMAN и CXB2_HUMAN получим последовательности для выравнивания из UniProt с помощью программы seqret.
    Последовательности были выравнены с помощью needle. Получили файл.

  5. Создание по данным БД ОРМ разметки трансмембранных сегментов в белке-прототипе.
  6. Откроем домашнюю страничку БД ОРМ, по PDB ID найдем описание ТМ-сегментов в белке-прототипе.
    Импортируем созданное в упр.1.2 выравнивание в Genedoc (needle 6.fasta 2.fasta -auto -aformat msf pp.msf). Под строчкой с выровненной последовательностью белка-прототипа поместим строчку с разметкой трансмембранных сегментов. Сохраните все в файле.

    фиолетовый цвет (символ H) - трансмембранные участки
    зеленый цвет (символ +) - цитоплазматические участки
    желтый цвет (символ -) - остальные

  7. Предсказание топологии белка CXB6_HUMAN с помощью наиболее популярной программы (TMHMM)
  8. Предскажем топологию заданного белка с помощью сервера TMHMM (опции по умолчанию, если бы не работал сервер, то использовали бы TMPred). На вход подаем последовательность белка в формате fasta, на выходе получаем страницу с результатами.

    Добавим к последовательностям в файле с прошлого задания еще одну искусственную последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания. Эту последовательность назовем "TMHMM". Получили файл.

    Окрашено в соответствии с данными сервера TMHMM для белка CXB6_HUMAN

    фиолетовый цвет (символ H) - трансмембранные участки
    зеленый цвет (символ +) - цитоплазматические участки
    желтый цвет (символ -) - остальные

Сравнение полученных предсказаний с данными ОРМ.

Рассмотрим полученное в последнем задании выравнивание и заполним таблицу:

Результаты предсказания топологии мембранного белка CXB6_HUMAN

 
Число а.к. остатков
Всего а.к. остатков
261
Остатки, предсказанные как локализованные в мембране (всего)
92
Правильно предсказали (true positives, TP)
76
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)
16
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)
156
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)
13
Чувствительность (sensivity) = TP / (TP+FN)
85.4%
Специфичность (specificity) =  TN / (TN+FP) 
90.7%
Точность(precision) = TP /(TP+FP)
82.6%
Сверхпредсказание = FP/ (FP+TP)
17.39%
Недопредсказание = FN / (TN+FN)
7.7%

Как видно из таблицы, довольно большое число предсказанных трансмембранных последовательностей неправильно сверхпредсказание, хотя число сегментов и их относительное расположение друг относительно друга верно. 7.7% трансмембранных последовательностей было пропущено при предсказании. Не смотря на это, мы видим высокую специфичность, чувствительность и точность.


©Пискунова Юлия 2010