Главная страница Первый семестр Второй семестр Третий семестр Четвертый семестр

Занятие 9. Транспортные белки.

  • Построение парного выравнивания исследуемого белка и заданного прототипа
  • Поиск последовательностей белка-прототипа в БД PDB и БД UniProt.
    На сайте банка PDB по ID 1okc был найден нужный белок. Его последовательность скачана по ссылке FASTA Sequence(файл). Для поиска белка в БД UniProt я использовала SRS(файл).
    Их сравнение в (файле)
    Характеристики выравнивания:
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 298
    # Identity: 297/298 (99.7%)
    # Similarity: 297/298 (99.7%)
    # Gaps: 1/298 ( 0.3%)
    # Score: 1542.0


    Последовательности отличаются по одному аминокислотному остатку: в записи PDB отсутствует первый метионин.

    По идентификатору UniProt (Q5KSP4)получена последовательность заданного белка(файл). Программой needle построено парное выравнивание этой последовательности и последовательности белка-прототипа из PDB(файл).
    Характеристики выравнивания:
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 298
    # Identity: 263/298 (88.3%)
    # Similarity: 281/298 (94.3%)
    # Gaps: 1/298 ( 0.3%)
    # Score: 1397.0

    Это выравнивание импортировано в GeneDoc и сохраните в файле под названием marking.msf

  • Разметка мембранных сегментов на выравнивании
  • По ID 1OKC PDB белка-прототипа было найдено описание ориентации белка в мембране в БД OPM (Orientations of Proteins in Membranes database). В соответствии с этим в программе GeneDoc к парному выравниванию заданного белка и прототипа была добавлена еще одна строка-"последовательность", где символами "H" обозначили позиции аминокислот мембранных сегментов,"+" - позиции цитоплазматических петель, "-" - остальные. Результат в файле файл.

  • Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  • Топология заданного белка предсказана с помощью сервера TMHMM(опции по умолчанию). Результат.

    В программе GeneDoc к выравниванию была добавлена четвертая "последовательность", где на основании предсказания TMHMM символами "H" обозначили позиции аминокислот мембранных сегментов, "+" - позиции цитоплазматических петель, "-" - позиции вне клетки. Результат.
    В выравнивании желтым - выровненные последовательности белков, зеленым - позиции мембранных аминокислот, одинаково предсказанные обоими описанными выше способами. Это же выравнивание в виде текстового файла формата Clustal.
    Сервисом TMHMM структуры были определены с высокой точностью, однако чувствительность метода в данном случае низкая, так как было предсказано всего 2 мембранные стуктуры из 6,определенных OPM.

  • Оценка качества предсказания
  • Результаты предсказания топологии мембранного белка Q5KSP4:

      Число а.к. остатков
    Всего а.к. остатков 298
    Остатки, предсказанные как локализованные в мембране (всего) 46
    Правильно предсказали (true positives, TP) 43
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 3
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 10
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 103
    Чувствительность (sensivity) = TP / (TP+FN) 0.29
    Специфичность (specificity) =  TN / (TN+FP)  0.76
    Точность (precision) = TP /(TP+FP)                        0.93
    Сверхпредсказание = FP/ (FP+TP)      0.06
    Недопредсказание = FN /(TN+FN)                                            0.91

    Сервис TMHMM предсказал только 2 мембранные стуктуры из 6,определенных OPM. Показатели Чувствительность-Специфичность-Точность отлично иллюстрируют полученные данные: хотя точность и специфичность велики, чувствительность оставляет желать лучшего. А так же большое недопредсказание - предсказано меньше половины.



    ©MARIA KUZNETSOVA,2008