Занятие 6

  1. Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
    1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
    2. Был выдан идентификатор PDB белка-прототипа:3G5U
      На домашней страничке PDBsum было получено выравнивание последовательности из UniProt и последовательности из PDB:
      Выравнивание в формате algn1.msf


      Нумерация в обеих базах данных совпадает. В базе данных PDB последовательность белка на 5 а.к.остатков меньше,чем в UniProt.

    3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
    4. Мне достались белок MDR1_CRIGR и белок-прототип MDR3_MOUSE. Полученные последовательности были отданы на вход программе needle:
      needle -asequence MDR1_CRIGR.fasta -bsequence MDR3_MOUSE.fasta -outfile mdr_mdr.needle
      
      На выходе получился файл mdr_mdr.needle

    5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
    6. Найдем по PDB ID (3G5U) описание ТМ-сегментов белка-прототипа MDR3_MOUSE в БД OPM.

      Белок MDR3_MOUSE имеет код 1.1.09.06, где:
      1. - Белок относится к типу трансмембранных белков (Transmembrane, 2 класса)
      1.1. - Белок относится к классу альфа-спиральных трансмембранных белков (Alpha-helical transmembrane, 57 надсемейств)
      1.1.09. - Белок относится к надсемейству ABC-транспортеров (ABC transporters, 6 семейств)
      1.1.09.06 - Белок относится к семейству не восприимчивых к лекарствам экспортеров(Multidrug resistance exporter (MDR))

      В БД OPM было получено описание ТМ-сегментов в белке-прототипе 3G5U.

      Описание ТМ-сегментов для цепи A:

      A - Tilt: 3° - Segments: 1( 48- 72), 2( 111- 131), 3( 185- 207), 4( 210- 233), 5( 290- 314), 6( 327- 348), 7( 708- 729), 8( 750- 773), 9( 827- 847), 10( 853- 872), 11( 931- 953), 12( 971- 988)

      Исходя из этих координат были найдены трансмембранные сегменты.
      Оставшиеся участки последовательности являются цитоплазматическими или внешними, выходящими наружу клетки. Для того, чтобы определить ориентацию этих участков относительно мембраны, белок рассматривался при помощи Jmol.

      Полученный файл marc.msf с выравниванием.

      Заметим, что у белка-прототипа 3G5U цепь А содержит 12 трансмембранных доменов. При этом почти вся цепь находится в цитоплазме, а лишь небольшая ее часть обращена во внеклеточное пространство. Цепь начинается и заканчивается на цитоплазматической стороне.

    7. Предсказать топологию заданного белка с помощью наиболее популярной программы TMHMM.
    8. Предскажем топологию белка MDR1_MOUSE с помощью сервера TMHMM.

      На вход подадим ему файл MDR1_CRIGR.fasta с последовательностью белка в формате FASTA.

      Выдача программы:

      # sp_P21448_MDR1_CRIGR Length: 1276
      # sp_P21448_MDR1_CRIGR Number of predicted TMHs:  11
      # sp_P21448_MDR1_CRIGR Exp number of AAs in TMHs: 247.07675
      # sp_P21448_MDR1_CRIGR Exp number, first 60 AAs:  12.77622
      # sp_P21448_MDR1_CRIGR Total prob of N-in:        0.98442
      # sp_P21448_MDR1_CRIGR POSSIBLE N-term signal sequence
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	     1    47
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	    48    70
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	    71   112
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   113   135
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	   136   186
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   187   209
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	   210   213
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   214   236
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	   237   291
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   292   314
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	   315   323
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   324   346
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	   347   706
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   707   729
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	   730   751
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   752   774
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	   775   847
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   848   870
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	   871   931
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   932   954
      sp_P21448_MDR1_CRIGR	TMHMM2.0	inside	   955   966
      sp_P21448_MDR1_CRIGR	TMHMM2.0	TMhelix	   967   989
      sp_P21448_MDR1_CRIGR	TMHMM2.0	outside	   990  1276
      
      
      

      Также прилагается график, отображающий предположение о топологии:

      Полученное предсказание добавим к выравниванию файла mark.msf в виде искусственной последовательности с разметкой трансмембранных спиралей под названием "TMHMM". Полученное выравнивание сохранено в формате msf в файлe mark2.msf

    9. Сравните полученное предсказание с данными ОРМ.
    10. Cравним предсказания, полученные с помощью программы TMHMM, с предсказаниями OPM.

        Число а.к. остатков
      Всего а.к. остатков 1277
      Остатки, предсказанные как локализованные в мембране (всего) 229
      Правильно предсказали (true positives, TP) 200
      Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 29
      Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 978
      Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 70
      Чувствительность (sensivity) = TP / (TP+FN) 0.7407 (74,07%)
      Специфичность (specificity) =  TN / (TN+FP)  0.9712 (97,12%)
      Точность(precision) = TP /(TP+FP) 0.8733 (87,33%)
      Сверхпредсказание = FP/ (FP+TP) 0.1266 (12,66%)
      Недопредсказание = FN / (TN+FN) 0.0667 (6,67%)

      Как видно из таблицы большая доля (12,66%) предсказанных трансмембранных сегментов не являлась таковой. К тому же 6,67% трансмембранных последовательностей было пропущено при предсказании. Можно заметить, что специфичность очень высока, при этом чувствительность и точность оказались ниже. Интересно, что предсказаны десять из двенадцати трансмембранных спиралей, при этом некоторые из этих спиралей предсказаны частично. Можно заметить, что локализацию достаточно большой части белка (примерно 350 позиции выравнивания) TMHMM предсказал как внеклеточную, в то время как OPM предсказал ее как трансмембранную.
       


      <<Обратно на четвертый семестр

      <<Обратно на главную страницу

      ©Лелекова Мария,2010