Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Функции, продолжение. Мембранные белки, транспортные белки.


  1. Построить выравнивание заданного белка ARPB_PSEPU и белка-прототипа MEXB_PSEAE с разметкой трансмембранных сегментов.
    1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
    2. Файл msf с выравниванием последовательности по данным UniProt и PDB (PDB ID: 2V50).
      Нумерация не совпадает, т. к. не полностью совпадают последовательности. Правило перевода нумерации PDB (N1) в нумерацию UniProt (N2):
      N2=N1+3, N1<497
      N2=N1+15, 496
      
      

    3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
    4. C помощью needle было получено глобальное выравнивание белков ARPB_PSEPU и MEXB_PSEAE.
      Выходной файл aln.needle

    5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
    6. По данным БД ОРМ, по PDB ID 2V50 было найдено описание ТМ-сегментов в белке-прототипе.
      Под строчкой с выровненной последовательностью белка-прототипа в выравнивании из задания 1.2 в GeneDoc добавлена строчка (OPM) с разметкой трансмембранных сегментов.
      файл mark.msf
      картинка из GeneDoc с раскрашенными доменами.
      Легенда:
      -, раскрашено голубым.............цитоплазматические петли
      H, раскрашено зеленым.............трансмембранные домены
      +, раскрашено розовым.............внеклеточные петли

    7. Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
    8. Страница с результатом предсказания.
      Эти результаты так же отображены в файле msf, ссылка на который дана в предыдущем задании (последовательность "TMHMM", обозначения те же).

  2. Сравните полученное предсказание с данными ОРМ.
  3. Скрипт был написан на Perl.

    Результаты предсказания топологии мембранного белка ARPB_PSEPU

      Число а.к. остатков
    Всего а.к. остатков 1050
    Остатки, предсказанные как локализованные в мембране (всего) 248
    Правильно предсказали (true positives, TP) 188
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 51
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 775
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 36
    Чувствительность (sensivity) = TP / (TP+FN) 0.839
    Специфичность (specificity) =  TN / (TN+FP)  0.938
    Точность(precision) = TP /(TP+FP) 0.787
    Сверхпредсказание = FP/ (FP+TP) 0.213
    Недопредсказание = FN / (TN+FN) 0.044
    Из таблицы видно, что у метода хорошие показатели специфичности и чувствительности, то низковата точность и достаточно большое сверхпредсказание. Предсказано 11 трансмембранных спиралей, в то время как на самом деле у белка их 12. Из-за этого ориентация части белка (~1-390) предсказана правильно, но непредсказанная 4-ая ТМ-спираль (394- 411) "инвертировала" всю оставшуюся часть белка относительно мембраны.



© Smirnova Victoriya, 2010