Занятие 9.

Ваша задача — предсказать топологию мембранного белка и сравнить результаты предсказания с описанием 3D-структуры близкого гомолога (белка-прототипа), ориентированной в мембране.

Идентификаторы заданного белка и белка-прототипа можно найти в таблице.

Срок выполнения заданий — вечер 20 апреля 2010 г.

Максимальный возможный балл за отчет зависит от способа вычислений в упр.2:

  1. Все верно, вычисления проведены "вручную" на основе изучения полученного размеченного выравнивания - 6 баллов.
  2. Все верно, вычисления проведены с помощью Excel - 7,5 баллов.
    Требования. Импортировать данные в удобном для дальнейшей работы виде, для всех вычислений использовать функции Excel.
  3. Все верно, все числа получены с помощью скрипта, написанного на языке Perl - 9 баллов.
  4. Требования. Скрипт читает и разбирает выходной файл программы предсказания, а также текстовой файл с описанием всех мембранных сегментов в БД ОРМ, производит необходимые вычисления и сохраняет результаты в текстовом файле. Коды скрипта приняты преподавателями курса программирования.

  1. Построить выравнивание заданного белка и белка-прототипа с разметкой трансмембранных сегментов.
    1. Сравнить нумерацию остатков белка-прототипа в UniProt и PDB
    2. Откройте домашнюю страничку БД PDBsum, предоставляющей краткое схематическое отображение информации о структуре. Найдите документ с заданным идентификатором PDB. Подведите курсор к выравниванию последовательности в структуре, щелкните по картинке и получите окно с выравниванием последовательности из UniProt и последовательности из PDB.
      Импортируйте выравнивание в Genedoc и сохраните как файл algn1.msf. Файл прикрепите к отчету.
      В отчете укажите, совпадает ли нумерация в 2-х БД, а,если, нет, то укажите правило перевода нумерации PDB в нумерацию UniProt.

      Подсказка.Как получить выравнивание? В окне с выравниванием выделите две строчки с последовательностями и их названиями "UniProt:" и "PDB seq:". Скопируйте их в текстовой файл. В два действия преобразуйте все в формат FASTA и сохраните файл. Импортируйте выравнивание в Genedoc.

    3. Постройте полное глобальное выравнивание заданного белка и белка-прототипа.
    4. По идентификаторам, указанным в таблице, получите последовательности для выравнивания из UniProt.
      В отчете укажите выбранную процедуру для выравнивания, прикрепите к отчету полученный файл с выравниванием.

    5. Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе.
    6. Откройте домашнюю страничку БД ОРМ, по PDB ID найдите описание ТМ-сегментов в белке-прототипе.
      Импортируйте созданное в упр.1.2 выравнивание в Genedoc. Под строчкой с выровненной последовательностью белка-прототипа поместите строчку с разметкой трансмембранных сегментов, см. подсказку. Сохраните все в файле mark.msf.

      Для того, чтобы разобраться, какие петли обращены в сторону цитоплазмы, а какие во внешнюю среду, воспользуйтесь подсказкой.

    7. Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM)
    8. Предскажите топологию заданного белка с помощью сервера TMHMM. (опции по умолчанию).
      Если сервер не будет работать, можно воспользоваться TMPred. Страничку с результатом предсказания прикрепите к отчету.

      Добавьте к последовательностям в файле mark.msf еще одну искусственную последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания. Эту последовательность назовите "TMHMM".

  2. Сравните полученное предсказание с данными ОРМ.
  3. Рассмотрите полученное выравнивание, и заполните таблицу вида:

    Результаты предсказания топологии мембранного белка....

      Число а.к. остатков
    Всего а.к. остатков  
    Остатки, предсказанные как локализованные в мембране (всего)  
    Правильно предсказали (true positives, TP)  
    Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)  
    Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)  
    Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)  
    Чувствительность (sensivity) = TP / (TP+FN)  
    Специфичность (specificity) =  TN / (TN+FP)   
    Точность(precision) = TP /(TP+FP)  
    Сверхпредсказание = FP/ (FP+TP)  
    Недопредсказание = FN / (TN+FN)  

    В кратком резюме оцените качество предсказания. Обязательно отметьте, все ли трансмембранные спирали предсказаны, правильно ли предсказана ориентация белка в мембране.


Подсказка. Как разметить трансмембранные сегменты с помощью GeneDoc?

Ниже изучаемой последовательности создайте искусственную последовательность такой же длины для описания предсказанной топологии. Для этого используйте опцию импорта последовательности как текста с клавиатуры. Создайте последовательность из несколько символов "-" с нужным Вам названием ("OPM", "Manual", "TMHMM"....). После чего переходите в режим редактуры остатков (Edit Residue Mode) и отметьте позиции мембранных сегментов буквой "Н", позиции цитоплазматических петель знаком "+", остальные — знаком "-".

Можно дополнительно раскрасить последовательность вручную (Manual shade mode). Может получиться очень красиво, но помните, что программа плохо сохраняет такую раскраску в файлах *.msf, поэтому надо часто экспортировать выравнивание в файлы *.htm * или *.rtf. Кроме того, в отчете следует пояснить, что как раскрашено.

Следите за номером позиции по размечаемой последовательности (на нижней панели справа)!!!

При разметке исследуемой последовательности по ОРМ помните, что нумерация в ОРМ соответствуют нумерация последовательности белка-прототипа в PDB!!

Подсказка. Как разобраться в ориентации трансмембранных спиралей?

На открытой странице ОРМ загрузите изображение в Jmol. Щелкните по картинке, откроется меню. Щелчок по кнопке "Spin=>off" остановит вращение. Щелчок по структуре должен привести к появлению имени атома внизу картинки.