Занятие 6.

Срок выполнения заданий — утро 30 марта 2010 г.
Формат отчета — HTML-страничка Pfam.html. Используйте коды табличек на страничке задания!
Наиболее высоко будет цениться качество выполнения заданий I.3 и II.3.

  1. Исследование доменной структуры конкретного белка
    1. Опишите доменную структуру белка по данным Pfam
    2. Откройте главную страничку БД Pfam. По идентификатору UniProt заданного белка найдите описание его доменной организации. В отчет вставьте табличку следующего вида:

      Доменная структура белка xxxх_Ecoli по данным Pfam

      Cхема из Pfam:
      Пояснения к схеме
      Pfam AC Pfam ID Полное название семейства домена
      (по-русски! и желательно с кратким пояснением)
      Положение в последовательности белка хххх_Ecoli Клан
      1. PF00218 IGPS  Индол-3-глицерофосфатсинтетаза,
      фермент, катализирующий 4-ый этап биосинтеза триптофана...
      4-252 Клан TIM_barrel (CL0036),
      содержит 54 сем-ва,
      у 5-ти неизвестна функция
      (PFAM ID начинается с DUF)
      2.      

    3. Экспортируйте в формате msf выравнивание-затравку (seed) для N-концевого домена заданного белка. Прикрепите полученный файл к отчету
    4. Сравните описание доменной структуры в Pfam с описанием в других БД
    5. Откройте главную страничку БД InterPro. По идентификатору UniProt заданного белка найдите описание всех подписей (signatures) , интегрированных в InterPro, т.е. имеющих InterPro ID. Cреди них найдите подпись, которая, на Ваш взгляд, наиболее отличается от подписей PFAM и может породить иное представление о первичной структуре заданного белка. Структурные мотивы на данном этапе можно (и даже лучше) опустить. В отчет внесите описание выбранного примера: картинку, название БД (полное!), InterPro ID, а также соображения, по которым был выбран именно этот пример.

    6. Сопоставьте доменную структуру с 3D структурой заданного белка
    7. Получите изображение 3D-структуры заданного белка, в которой цветом выделены отдельные домены в последовательности.
      Подсказка.
      Откройте страничку Pfam с доменной структурой заданного белка. Щелкните по кнопке "Structures" в левом меню. В открывшемся списке структур выберите структуру, содержащую, по крайней мере, 2 домена. Щелкните по кнопке "View structure" и выберите программу Jmol. Если не повезло (невозможно разобраться в картинке из-за большого количества одинаковых цепей), то щелкните по картинке, в выпавшем меню выберите кнопку "Console" и введите в командное окно команду display *:A.

      Рассмотрите изображение и в отчете попробуйте ответить на следующие вопросы:
      • соответствуют ли домены Pfam отдельным компактным частям структуры (структурным доменам), или нет?
      • если домен Pfam попадает на отдельный структурный домен, то насколько полно такое совпадение?
      Примечание.
      К сожалению, JMol на сайте Pfam не дает возможности экспортировать картинку, но, возможно, нужная картинка найдется среди готовых, см. окошки справа. Хорошо, если найдется подходящая, но не нужно прикреплять к отчету невнятные картинки, картинки без пояснений и т.п.

  2. Исследование эволюции отдельных доменов
    1. Опишите, как часто и в каких организмах встречаются домены заданного белка
    2. Откройте страничку Pfam с доменной структурой заданного белка. Щелчок по изображению конкретного домена откроет страничку с его описанием. Запишите в отчет, в организмах скольких видов встречаются белки с каждым из доменов заданного белка. Выберите один из доменов (не рекомендуется брать домены, встречающиеся слишком часто или слишком редко) и откройте таксономическое дерево PFAM. По данным для выбранного домена заполните следующую табличку. В кратком резюме сделайте вывод о распространенности изучаемого домена.

      Представленность домена PFxxxx в организмах разных видов

      Таксон
      Количество белков с доменом PF:::::.
      Эукариоты Зеленые растения  
      Грибы  
      Животные  
      Остальные эукариоты  
      Бактерии  
      Археи  

    3. Определите, в скольких разных белках Escherichia coli K12 встречаются домены, представленные в заданном белке
    4. Откройте страничку с таксономическом деревом Pfam для первого из доменов заданного белка. С помощью команды Ctrl+F браузера найдите таксон Escherichia coli (strain K12) . Поставьте перед названием таксона галочку и щелкните по кнопке View graphically в правом меню. Изучите открывшуюся страничку и занесите результаты в табличку, см. ниже. Повторите то же для каждого из доменов заданного белка. Ниже таблички приведите число белков с точно такой же доменной организацией, что и заданный белок. Сделайте краткий вывод о частоте доменов в белках кишечной палочки.

      Представленность изучаемых доменов в белках Escherichia coli (strain K12)

      PFAM ID Количество белков в Escherichia coli (strain K12)
      1.    
           

    5. Приведите не менее 3-х примеров разных доменных перестроек
    6. Для каждого из доменов заданного белка рассмотрите странички с вариантами доменной организации и подберите наиболее яркие примеры доменных перестроек. Для каждого примера в отчете приведите идентификатор PFAM и название домена, две картинки, иллюстрирующие перестройки, и краткое описание перестройки.
      Пример :
      Домен PF00532 (Peripla_BP_1) встречается в сочетании с разными доменами, причем бывает как на N-, так и на С-конце последовательности.
      AGLR_RHIME:      B5YAI5_DICT6:

      Чем не тривиальнее пример, тем лучше!! Обратите внимание на однодоменные и многодоменные варианты, на дупликации доменов, на разрывы в последовательности доменов и т.п.
      Студенты, получившие для выполнения данного задания новый белок, могут поискать яркие примеры и для доменов старого белка.