Мембранные белки, транспортные белки


  1. Построение выравнивания заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
    1. Сравнение нумерации остатков белка-прототипа MDR3_MOUSE в UniProt и PDB
    2. Белок MDR3_MOUSE представляет собой фермент и состоит из двух цепей - A и B.
      Получим выравнивание последовательностей этого белка из БД UniProt и PDB.
      Полученное варвнивание сохранено в файле algn1.msf .
      Нумерация совпадает в обеих БД, но последовательность белка из БД PDB на 94 аминоксилотных остатка короче, чем из UniProt. В связи с этим есть один внутренний гэп и концевые гэпы.

    3. Полное глобальное выравнивание белка MDR2_MOUSE и белка-прототипа MDR3_MOUSE.
    4. Из БД UniProt получим последовательности белков MDR2_MOUSE и MDR3_MOUSE .
      С помощью программы needle (параметры стандартные) выровняем этим две последовательности. Полученное выравнивание сохранено в файле mdr_aln.needle . Процент идентичности белков составляет 73%, процент сходства - 84,6%, процент гэпов - 2,8%.

    5. Создание по данным БД ОРМ разметки трансмембранных сегментов в белке-прототипе MDR3_MOUSE.
    6. В БД ОРМ найдем описание TM-сегментов в белке-прототипе MDR3_MOUSE (его PDB ID 3G5U). Это P-гликопротеид - белок, ответственный за выведение цитостатиков из клетки.
      Описание:
      Тип: 1. Трансмембранные белки
      Класс: 1.1 Альфа-спиральные трансмембранные белки
      Надсемейство: 1.1.09 ADC-транспортеры
      Семейство: 1.1.09.06 Белки-экспортеры, имеющий множественную лекарственную устойчивость (Multidrug resistance exporter)
      Описание TM-сегментов:
      A - Tilt: 3° - Segments: 1( 48- 72), 2( 111- 131), 3( 185- 207), 4( 210- 233), 5( 290- 314), 6( 327- 348), 7( 708- 729), 8( 750- 773), 9( 827- 847), 10( 853- 872), 11( 931- 953), 12( 971- 988)
      Изображение, полученное с помощью Jmol:


      Красным цветом отмечетна внешняя сторона мембраны, синим - цитоплазаматическая.
      К созданному в упражнеии 1.2 выравниванию была добавлена еще одна строка "OPM" c разметкой трансмембранных сегментов. В этом файле ( mark.msf ) позиции мембранных сегментов отмечены буквой "Н", позиции цитоплазматических петель знаком "+", остальные - знаком "-".

    7. Предсказание топологии заданного белка MDR2_MOUSE с помощью программы TMHMM
    8. С помощью сервера TMHMM было получено предсказание топологии белка MDR2_MOUSE. Полученное предсказание о топологии белка:
       # sp_P21440_MDR2_MOUSE Length: 1276
       # sp_P21440_MDR2_MOUSE Number of predicted TMHs:  10
       # sp_P21440_MDR2_MOUSE Exp number of AAs in TMHs: 240.7686999999999999999999999999
       # sp_P21440_MDR2_MOUSE Exp number, first 60 AAs:  8.40492
       # sp_P21440_MDR2_MOUSE Total prob of N-in:        0.89965
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	     1    51
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	    52    74
       sp_P21440_MDR2_MOUSE	TMHMM2.0	outside	    75   114
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   115   137
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	   138   188
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   189   208
       sp_P21440_MDR2_MOUSE	TMHMM2.0	outside	   209   212
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   213   235
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	   236   293
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   294   316
       sp_P21440_MDR2_MOUSE	TMHMM2.0	outside	   317   325
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   326   348
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	   349   750
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   751   773
       sp_P21440_MDR2_MOUSE	TMHMM2.0	outside	   774   847
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   848   870
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	   871   932
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   933   955
       sp_P21440_MDR2_MOUSE	TMHMM2.0	outside	   956   969
       sp_P21440_MDR2_MOUSE	TMHMM2.0	TMhelix	   970   992
       sp_P21440_MDR2_MOUSE	TMHMM2.0	inside	   993  1276
       


      Результаты этого предсказания прикреплены к файлу mark.msf в виде искусственной последовательности "ТМНММ" с разметкой трансмембранных спиралей в соответствии с предсказанием.

  2. Сравнение полученного предсказания с данными ОРМ.
  3.   Число а.к. остатков
    Всего а.к. остатков 1276
    Остатки, предсказанные как локализованные в мембране (всего) 226
    Правильно предсказали (true positives, TP) 162
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 64
    Правильно не предсказали не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 986
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 64
    Чувствительность (sensivity) = TP / (TP+FN) 0.716814159292035
    Специфичность (specificity) =  TN / (TN+FP)  0.939047619047619
    Точность(precision) = TP /(TP+FP) 0.716814159292035
    Сверхпредсказание = FP/ (FP+TP) 0.283185840707965
    Недопредсказание = FN / (TN+FN) 0.060952380952381

    Вычисления произведены с помощью скрипта script.pl

    Точность предсказания не очень высокая - примерно 72%. Но зато довольна высока специфинчость (94%). Сверхпредсказано гораздо больше, чем недопредсказано (28% против 6%). Это связано с тем, что ТМНММ в основном указывает более широкие границы для участков. Все участки указаны верно, но области, предсказанные ТМНММ, больше.