Занятие 9. Транспортные белки.

Цель: предсказать топологию мембранного белка и сравнить предсказание с ориентированной в мембране 3D-структурой
белка-прототипа.

  1. Построение парного выравнивания исследуемого белка и заданного прототипа
  2. а) На сайте банка PDB по ID 1LDF был найден нужный белок.
    Полученный файл в формате fasta.

    б) Для поиска белка в Uniprot была использована база данных SRS
    (Library Page -> UniProtKB/Swiss-Prot -> Query Form -> AC P0AER0).
    Полученный файл в формате fasta.

    Для сравнения последовательностей белка-прототипа была использована програма GeneDoc.
    Полученный файл в формате html.

    Из файла видно, что последовательности белка-прототипа, полученные из разных БД, отличаются по 200ой позиции.

    Выравнивание заданного белка (UniProt) и белка-прототипа (PDB).

    Парное выравнивание получено с помощью программы needle.
    Характеристики выравнивания:
      Gap_penalty: 10.0            
      Extend_penalty: 0.5          
                                   
      Length: 283                  
      Identity:     224/283 (79.2%)
      Similarity:   252/283 (89.0%)
      Gaps:           6/283 ( 2.1%)
      Score: 1179.5
      
    Готовое выравнивание было импортированно в GeneDoc.
    Полученный файл marking.msf

  3. Разметка мембранных сегментов на выравнивании
  4. Использовалась база данных OPM.

    По идентификатору PDB белка-прототипа было найдено описание ориентации белка в мембране.
    В соответствии с этим в программе GeneDoc к парному выравниванию заданного белка и прототипа была добавлена еще одна строка-"OPM", где символами "H" обозначили позиции аминокислот мембранных
    сегментов, "+" - позиции цитоплазматических петель (и хвостов), "-" - остальные (в периплазме).

    Полученный файл marking1.msf

  5. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)
  6. Использованный сервер TMHMM

    Результат предсказания с сервера.

    В программе GeneDoc к выравниванию была добавлена четвертая "последовательность" TMHMM,
    где на основании предсказания TMHMM символами "H" обозначили позиции аминокислот мембранных
    сегментов, "+" - позиции цитоплазматических петель (и хвостов), "-" - позиции вне клетки.

    Полученный файл в формате html.
    В файле фиолетовым раскрашены выровненные последовательности белков, а желтым - позиции
    мембранных аминокислот, одинаково предсказанные обоими описанными выше способами.

    Полученный файл в формате Clustal.

  7. Оценка качества предсказания
  8. Сравните полученное предсказание с данными ОРМ. Рассмотрите полученное выравнивание, и заполните таблицу вида:

    Результаты предсказания топологии мембранного белка Q6CZ87

      Число а.к. остатков
    Всего а.к. остатков 279
    Остатки, предсказанные как локализованные в мембране (всего) 135
    Правильно предсказали (true positives, TP) 114
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 21
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 117
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 27
    Чувствительность (sensivity) = TP / (TP+FN) 0.8
    Специфичность (specificity) =  TN / (TN+FP)  0.85
    Точность (precision) = TP / (TP+FP)                        0.844
    Сверхпредсказание = FP/ (FP+TP)      0.155
    Недопредсказание = FN / (TN+FN)                                      0.1875

    По данным таблицы, можно сделать вывод о том, что основные мембранные участки белка предсказаны правильно.
    Точность предсказания имеет довольно высокое значение, равное 0.844, в то же время параметры сверхпредсказание
    и недопресказание имеют практически равные низкие значения.
    Хотя погрешности в предсказании все таки присутсвуют, так сервис
    TMHMM не обнаружил 2 мембранных участка, показанных на прототипе в OPM.
Домашняя страница
Copyright 2009. Голяев Виктор.