Занятие 9.

  1. Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
    1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
    2. На странице БД PDBsum, предоставляющей краткое схематическое отображение информации о структуре, соответствующей записи PDB ID белка-прототипа 2QTS, было получено выравнивание последовательности из UniProt и последовательности из PDB.
      Выравнивание в fasta формате fasta. Импортируем выравнивание в GeneDoc и сохраним его gene.msf. Нумерация в двух БД совпадает, но в PDB последовательность короче на C-конце и на N-конце. Начинается она с 42-го остатка последовательности БД UniProt.

    3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
    4. По идентификаторам белка ACCN2_RAT, белка-прототипа ACCN2_CHICK получим последовательности для выравнивания из UniProt программой seqret пакета EMBOSS accn2_rat.fasta и accn2_chick.fasta.
      Построим полное глобальное выравнивание белков с помощью программы needle
      needle accn2_chick.fastaaccn2_rat.fasta  rat_chick.needle -auto
      Получили rat_chick.needle

    5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
    6. 1)Откроем домашнюю страничку БД ОРМ. По PDB ID (2QTS) найдем описание ТМ-сегментов в белке-прототипе ACCN2_CHICK. описание

      2qts.gif (красным обозначена наружняя мембрана клетки,а синим-внутренняя)

      Белок ACCN2_CHICK имеет код 1.1.42.01.
      1. Тип трансмембранных белков (Transmembrane).
      1.1. Класс альфа-спиральных трансмембранных белков (Alpha-helical transmembrane).
      1.1.42.Суперсемейство эпителиальных натриевых каналов (Epithelial sodium channel (ENaC)).
      1.1.42.01. Семейство кислотно-чувствительных ионных каналов (Acid-sensing ion channels).
      Локализован в плазматической мембране эукариот.
      2)Переведем глобальное выраавнивание в msf-формат.
      needle accn2_chick.fasta accn2_rat.fasta rat_chick.msf -aformat msf 

      Получили rat_chick.msf
      3)На странице БД ОРМ находим трансмембранные сегменты.
      A - Tilt: 5° - Segments: 1(45-70), 2(427-452)
      4)По картинке Jmol определяем координаты цитоплазматических петель
      (454-457), (44-42) цепь А
      Трансмембранные участки белка были отмечены на выравнивании последовательностей белка ACCN2_RAT и белка ACCN2_CHICK (которое было импортировано в Gendoc).

      символ H - трансмембранные участки
      символ + - цитоплазматические участки
      символ - - остальные
      Сохранено в msf формате opm_1.msf

    7. Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
    8. Предскажем топологию заданного белка с помощью сервера TMHMM. (опции по умолчанию).


      Не предсказано ни цитоплазматических петель,ни трансмембранных сегментов. Запрос не совпал с данными OPM

  2. Сравните полученное предсказание с данными ОРМ.
  3. Попробуем поискать в документе Uniprot о белке ACCN2_CHICK. Действительно в Uniprot указаны трансмембранные сегменты: (42-62), (427-447)
    Отметим их на выравнивании и сохраним opm_2.msf
    Покажем пересечение на выравнивании OPM и Uniprot mark_2.gif
    Сравним данные UniProt относительно данных OPM.

    Результаты предсказания топологии мембранного белка....

      Число а.к. остатков
    Всего а.к. остатков 527
    Остатки, предсказанные как локализованные в мембране (всего) 42
    Правильно предсказали (true positives, TP) 39
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 3
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 475
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 13
    Чувствительность (sensivity) = TP / (TP+FN) 0,75
    Специфичность (specificity) =  TN / (TN+FP)  0,99
    Точность(precision) = TP /(TP+FP) 0,93
    Сверхпредсказание = FP/ (FP+TP) 0,07
    Недопредсказание = FN / (TN+FN) 0,027

    Пришлось использовать в качестве предсказания данные Uniprot. Исходя из этого, предсказание получилось очень специфичным, точным, все трансмембранные спирали предсказаны, . Недо- и сверхпредсказания говорят в пользу предсказания.

    Но чувствительность не максимальна, т.к. было предсказано мало трансмембранных остатков по сравнению с реальным количеством трансмембранных остатков. Ориентация белка: одна- от внеш. мембраны к внутр., другая- наоборот.