Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Проект "Поиск белка с заданной функциональной специфичностью."


  1. Первый этап: описание функциональных особенностей заданной группы.
  2. В качестве белка-прототипа мне задан белок из Klebsiella pneumoniae (strain 342) B5Y088_KLEP3 (репрессор сахарозного оперона).
    Данных об эффекторе на странице UniProt нет. Это ДНК-зависимый транскрипционный фактор, отвечающий на фруктозу (описание по терминам GO, указанным в UniProt).

  3. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.
    1. Создать хорошее множественное выравнивание доменов группы белков purr.
    2. Требуется построить выравнивание ДНК-связывающих доменов заданной группы белков.
      Такое выравнивание рекомендовано строить по данным БД SMART, а не PFAM, т. к. в Pfam кроме нужного домена HTH_LACI (LacI в Pfam) аннотирован домен Peripla_BP_1:



      Файл с представительским выравниванием SMART.
      Файл с последовательностями всех доменов HTH_LACI.
      Файл с выравниванием (группа purr).

    3. Создать единое множественное выравнивание эффекторсвязывающих доменов всех групп специфичности.
    4. Заданная мне для иследования группа - scrr - в выравнивании помещена первой и отмечена оранжевым цветом.

      Файл с выравниванием и разметкой по группам.
      Картинка выравнивания с разметкой по группам (4,71 МБ).
      • Позиции выравнивания, консервативные (одинаковые) и характерные только для моей группы (scrr):
        52, 253.
      • Позиции выравнивания, консервативные (одинаковые) только для моей группы (scrr), но встречабющиеся и в других группах:
        29, 58, 70, 72, 83, 90, 108, 160, 169, 210, 212, 225, 257, 262, 263, 265.
      • Позиции выравнивания, консервативные (одинаковые) для нескольких групп, включая мою:
        34, 36-38, 44, 49, 50, 57, 64, 65, 68, 73-76, 79, 85, 95, 101, 104, 105, 107, 109, 110, 112, 114, 117, 143, 145, 146, 149, 150, 166, 167, 185, 201, 203, 204, 209, 213, 217, 218, 221, 226, 233, 244, 260, 261.
      Позиции из пунктов 1 и 2 - специфичны для данной группы. Позиции из пункта 3, скорее всего, наиболее важные для функции связывания эффектора, т. к. встречаются у многих групп этого домена.

    5. Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.
    6. Использован ресурс WebLogo.
      logo для всех эффекторсвязывающих доменов.
      logo для эффекторсвязывающих доменов группы scrr.

  4. Третий этап: построения профиля для группы scrr и поиск по нему в протеоме Pantoea ananatis LMG 20103.
    1. Создание и нормирование профиля.
    2. Сначала к выравниванию эффекторсвязывающих доменов семейства scrr с помощью программы pfw были добавлены веса. Команда:
      pfw -m scrr_.fasta > scrr.ali
      Команда для построения профиля по выравниванию:
      pfmake -m scrr.ali /usr/share/pftools23/blosum45.cmp > scrr_profile.prf
      Вручную профиль не редактировался, т. к. ни один из белков семейства не имеет PDB-структуры и установить заведомо функциональные остатки нельзя. Нормирование профиля:
       autoscale -m scrr_profile.prf > scrr_profile.scaled.prf 

    3. Поиск по профилю в протеоме Pantoea ananatis LMG 20103.
    4. Поиск проводился с тремя значениями порога: 5, 10 и 30.

      Порог 5.0, 50 находок:
      pfsearch -C 5.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr5.search
      Порог 10.0, 17 находок:
      pfsearch -C 10.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr10.search
      Порог 30.0, 1 находка:
      pfsearch -C 30.0 -f scrr_profile.scaled.prf Pantoea.fasta > scrr30.search
      Файл с последовательностями, найденными при пороге 10.0.
      Файл с выравниванием найденных последовательностей по созданному ранее выравниванию доменов семейства scrr. Выравнивание проводилось программой clustalw2. То же в формате msf.
      Картинка выравнивания; ярко-оранжевым в группе scrr отмечены позиции, признанные специфичными (п. 1, 2 из задания 2.2), светло-оранжевым в находках отмечены совпадающие со специфичными остатки.
      То же выравнивание в формате msf
      Из картинки видно, что в белке 336 есть все специфичные позиции, поэтому вероятность принадлежности его к данной группе специфичности (scrr) велика. Во многих других находках есть специфичные для группы позиции, но нет ни одного белка, кроме 336, в котором присутствовали бы все такие позиции.



© Smirnova Victoriya, 2010