Задание 9 (выполнено Борисовой Мариной)

Данные:

Задача.

Предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.

    1. Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
      1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
      2. Заданный белок - белок-насос для потока ионов железа (FIEF_YERE8) из бактериального организма Yersinia enterocolitica serotype O:8 / biotype 1B (strain 8081). Имеет длину 300 а.о.
        Белок-прототип - белок-насос для потока ионов железа(FIEF_ECOLI) из Escherichia coli. Имеет длину 300 а.о. Представляет собой мембранный канальный белок, который ответствен за транспорт ионов железа при их избытке.

        При нажатии на картинку с выравниванием полседовательности в структуре появляется выравнивание.Нумерация выравниваний не совпадает, правило перевода: PDB=UniProt+7.

        Выравнивание преобразованное в fasta-формат было импортировано в GeneDoc и сохранено в файле algn1.msf.

      3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
      4. Получив последовательность заданного белка через UniProt, построила ее парное выравнивание с последовательностью из PDB:

        needle FIEF_ECOLI.fasta FIEF_YERE8.fasta ECOLI_YERE8.needle -auto

        Характеристики выравнивания: процент идентичности 78, процент сходства 90.3

      5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
      6. Цветами тут обозначены: оранжевый - трансмембранный домен, фиолетовый - цитоплазматический. Данное выравнивание лежит в файле.

      7. Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
      8. Через сервер TMHMM (опции по умолчанию) получили следующий файл, после обработки данной информации чере GenDoc получили итоговый файл.

    2. Сравните полученное предсказание с данными ОРМ.
    3. Рассмотрите полученное выравнивание, и заполните таблицу вида:

      Результаты предсказания топологии мембранного белка FIEF_YERE8

        Число а.к. остатков
      Всего а.к. остатков  300
      Остатки, предсказанные как локализованные в мембране (всего)  129
      Правильно предсказали (true positives, TP)  94
      Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)  35
      Правильно не предсказали (не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)  158
      Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)  13
      Чувствительность (sensivity) = TP/(TP+FN) 0,88 (88%)
      Специфичность (specificity) =  TN/(TN+FP)  0,82 (82%)
      Точность(precision) = TP/(TP+FP) 0,73 (73%)
      Сверхпредсказание = FP/(FP+TP) 0,27 (27%)
      Недопредсказание = FN/(TN+FN) 0,076 (7,6%)

      По данным таблицы предсказание получилось достаточно специфичным (то есть было предсказано крайне мало трансмембранных остатков там, где не нужно, по отношению к общему количеству немембранных остатков), но мало точным (то есть среди всех предсказанных трансмембранных остатков было относительно мало предсказанных остатков, не являющимися трансмембранными (но они всё же были)). Сверхпредсказание, на мой взгляд, оказалось велико. Зато недопредсказание оказалось очень маленьким, а чувствительность предсказания велика (то есть было предсказано много трансмембранных остатков по сравнению с реальным количеством трансмембранных остатков). Все эти факты говорят, что предсказанию можно доверять (хотя и с осторожностью из-за сверхпредсказания).

      В выравнивании последовательность белка FIEF_YERE8 содержит 6 трансмембранных доменов, что совпадает с данными полученными через сервер TMHMM. А также правильно предсказание ориентации белка в мембране: все цитоплазматические аминокислоты предсказанные относительно совпадают с цитоплазматическими аминокислотами в выравнивании.


    © 2010 Borisova Marina