Функции, продолжение. Мембранные белки, транспортные белки

  1. Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.

      Заданный белок: MDR2_CRIGR. Белок-прототип: MDR3_MOUSE.

    1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
    2. На странице БД PDBsum, предоставляющей краткое схематическое отображение информации о структуре, найдем документ с заданным идентификатором PDB белка прототипа - 3G5U. Подведя курсор к выравниванию последовательности в структуре и щелкнув по картинке, получим окно с выравниванием последовательности из UniProt и последовательности из PDB.
      Импортируем выравнивание в Genedoc и сохраните как файл algn1.msf.

      Нумерация в обеих базах данных совпадает.

    3. Построение полного глобального выравнивания.
    4. В БД UniProt были получены последовательности заданного белка MDR2_CRIGR и белка-прототипа MDR3_MOUSE.

      Глобальное выравнивание было построено при помощи программы needle:

      needle -asequence P21449.fasta -bsequence P21447.fasta -outfile P21449-P21447.needle  
      Gap_penalty: 10.0
      Extend_penalty: 0.5

    5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе

      На домашней странице БД ОРМ, по PDB ID 3G5U найдем описание ТМ-сегментов в белке-прототипе.

    P-glycoprotein:
    Type:
    1. Transmembrane
    Class: 1.1. Alpha-helical transmembrane
    Superfamily: 1.1.09. ABC transporters
    Family: 1.1.09.06. Multidrug resistance exporter (MDR)
    Species: Mus musculus
    Localization: Eukaryotic plasma membrane

      A - Tilt: 3° - Segments: 1( 48- 72), 2( 111- 131), 3( 185- 207), 4( 210- 233), 5( 290- 314), 6( 327- 348), 7( 708- 729), 8( 750- 773), 9( 827- 847), 10( 853- 872), 11( 931- 953), 12( 971- 988)

      Исходя из этих координат были найдены трансмембранные сегменты.
      На основании описания добавим в созданное в предыдущем пункте выравнивание строчку с разметкой трансмембранных сегментов.


      Внешняя часть мембраны изображена красным, внутренняя - синим.

    Полученное выравнивание (mark.msf).

    4. Предсказание топологии заданного белка с помощью программы TMHMM

      Предскажем топологию заданного белка MDR2_CRIGR с помощью сервера TMHMM.

      На вход подадим ему файл MDR2_CRIGR.

      Выдача программы:

      # sp_P21449_MDR2_CRIGR Length: 1276  
      # sp_P21449_MDR2_CRIGR Number of predicted TMHs: 11
      # sp_P21449_MDR2_CRIGR Exp number of AAs in TMHs: 250.10729
      # sp_P21449_MDR2_CRIGR Exp number, first 60 AAs: 11.68149
      # sp_P21449_MDR2_CRIGR Total prob of N-in: 0.99408
      # sp_P21449_MDR2_CRIGR POSSIBLE N-term signal sequence
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 1 48
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 49 71
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 72 114
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 115 137
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 138 188
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 189 211
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 212 215
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 216 238
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 239 293
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 294 316
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 317 325
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 326 348
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 349 715
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 716 738
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 739 752
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 753 775
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 776 844
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 845 867
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 868 935
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 936 958
      sp_P21449_MDR2_CRIGR TMHMM2.0 inside 959 970
      sp_P21449_MDR2_CRIGR TMHMM2.0 TMhelix 971 993
      sp_P21449_MDR2_CRIGR TMHMM2.0 outside 994 1276


      График, отображающий предположение о топологии:

      Полученное предсказание добавим к выравниванию файла mark.msf в виде искусственной последовательности с разметкой трансмембранных спиралей под названием "TMHMM".
      Полученное выравнивание сохранено в формате msf (mark2.msf).

  2. Сравните полученное предсказание с данными ОРМ.
  3. Рассмотрим полученное выравнивание. По имеющимся уже данным OPM и TMHMM построим таблицу:

    Результаты предсказания топологии мембранного белка MDR2_CRIGR

      Число а.к. остатков
    Всего а.к. остатков 1276
    Остатки, предсказанные как локализованные в мембране (всего) 253
    Правильно предсказали (true positives, TP) 211
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 42
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 965
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 57
    Чувствительность (sensivity) = TP / (TP+FN) 0.7873
    Специфичность (specificity) =  TN / (TN+FP)  0.9583
    Точность(precision) = TP /(TP+FP) 0.8340
    Сверхпредсказание = FP/ (FP+TP) 0.1660
    Недопредсказание = FN / (TN+FN) 0.0558


    Необходимо отметить, что одна трансмембранная спираль не была предсказана TMHMM. На месте 9 и 10 трансмембранной спирали в OPM в TMHMM предсказана только одна трансмембранная спираль, в результате чего далее неверно определена ориентация.
    Сверхпредсказание преобладает над недопредсказанием почти в 3 раза..



©2008-2010 Михальченко Алексей