Занятие 9. Транспортные белки.

Задача - предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой белка-прототипа.

Идентификаторы заданного белка O55143, белка-прототипа P04191 (1SU4)

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. Первая последовательность (исследуемая) 1.fasta
    Вторая последовательность (из PDB) 2.fasta
    Выравнивание было построено с помошью программы needle.
    Параметры выравнивания:

        # Matrix: EBLOSUM62
        # Gap_penalty: 10.0
        # Extend_penalty: 0.5
        #
        # Length: 1045
        # Identity:     840/1045 (80.4%)
        # Similarity:   934/1045 (89.4%)
        # Gaps:          45/1045 ( 4.3%)
        # Score: 4389.0
    
    Полученное выравнивание marking.msf

  3. Разметка мембранных сегментов на выравнивании
  4. По идентификатору PDB белка-прототипа нашли описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database)
    На выравнивании отметили указанные трансмембранные участки.
    1(57-76), 2(87-105), 3(260-274), 4(288-306), 5(762-781), 6(789-806), 7(834-853), 8(897-915), 9(931-949), 10(966-987)

  5. Предсказание топологии заданного белка с помощью программы TMHMM-2.0
  6. Предсказали топологию заданного белка с помощью сервера TMHMM..
    Результаты поиска представлены на странице TMHMM result
    К последовательностям в файле marking.msf еще одну искусственную последовательность, отражающую результаты данного предсказания.
    Готовое выравнивание Shalaeva.htm
    В формате Clustal Shalaeva.aln

  7. Оценка качества предсказания
  8. Примечание Поскольку исслдуемый белок на 43 аминокислотных остатка длиннее своего прототипа, трансмембранный участок, предсказаннный в этом участке сравнивать нечем, по этому для оценки правдоподобия рассматривались первые 1000 аминокислотных остатков.

    Результаты предсказания топологии мембранного белка

      Число а.к. остатков
    Всего а.к. остатков 1000
    Остатки, предсказанные как локализованные в мембране (всего) 172
    Правильно предсказали (true positives, TP) 118
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 33
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 630
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 75
    Чувствительность (sensivity) = TP / (TP+FN) 0.611 (61.1%)
    Специфичность (specificity) =  TN / (TN+FP)  0.95 (95%)
    Точность (precision) = TP /(TP+FP)                         0.781 (78.1%)
    Сверхпредсказание = FP/ (FP+TP)      0.218 (21.8%)
    Недопредсказание = FN /(TN+FN)                                             0.106 (10.6%)

    Таким образом, программой TMHMM былпредсказан один трансмембранный участок, который сравнивать не с чем, поскольку соответствующего фрагмента в белке-прототипе нет, два трансмембранных участка, указанных для прототипа найдены не были. В то же время остальные найденные участки хорошо пререкрываются с предсказанными, по этому у данного метода достаточно неплохие показатели - высокие специфичность и точность, небольшое недопредсказание.