Самый простой способ создать отчет в формате HTML — это скопировать страничку задания, а затем ее отредактировать!

Занятие 12. Эволюционные домены. БД Pfam, InterPro.

Ваша рабочая директория — H:\Term2\Practice12, в ней храните все рабочие файлы.
Формат отчета — HTML-страничка со ссылкой со страницы второго семестра.
Срок — утро дня следующего занятия.

  1. Опишите доменную структуру данного вам белка по данным Pfam.
  2. Откройте главную страничку базы данных Pfam. По идентификатору UniProt своего белка найдите описание его доменной организации. В отчет вставьте табличку следующего вида:

    Доменная структура белка XXXX_BACSU по данным Pfam

    Cхема из Pfam:
    Пояснения к схеме
    Pfam AC Pfam ID Полное название семейства доменов
    (по-русски! и желательно с кратким пояснением)
    Положение в последовательности белка XXXX_BACSU Клан
    1. PF00218 IGPS Семейство доменов названо по названию фермента индол-3-глицерофосфатсинтетазы,
    фермента, катализирующего четвёртый этап биосинтеза триптофана...
    4–252 Клан TIM_barrel (CL0036), содержит 54 семейства, у пяти неизвестна функция (PFAM ID начинается с DUF)
    2.      

  3. Опишите, как часто и в каких организмах встречаются домены заданного белка
  4. Откройте страничку Pfam с доменной структурой заданного белка. Щелчок по изображению конкретного домена откроет страничку с его описанием. Запишите в отчет, в организмах скольких видов встречаются белки с каждым из доменов заданного белка. Выберите один из доменов (не рекомендуется брать домены, встречающиеся слишком часто или слишком редко) и откройте таксономическое дерево PFAM. По данным для выбранного домена заполните следующую табличку. В кратком резюме сделайте вывод о распространенности доменов.

    Представленность домена PFxxxx в организмах разных видов

    Таксон
    Количество белков с доменом PFxxxxxx.
    Эукариоты Зеленые растения  
    Грибы  
    Животные  
    Остальные эукариоты  
    Бактерии  
    Археи  

  5. Определите, в скольких разных белках Bacillus subtilis встречаются домены, представленные в заданном белке
  6. Откройте страничку с таксономическом деревом Pfam для первого из доменов заданного белка. С помощью контекстного поиска (<Ctrl+F> в большинстве браузеров) найдите таксон. Поставьте перед названием таксона галочку и щелкните по кнопке View graphically в правом меню. Изучите открывшуюся страничку и занесите результаты в табличку, см. ниже. Повторите то же для каждого из доменов заданного белка. Ниже таблички приведите число белков с точно такой же доменной организацией, что и заданный белок. Сделайте краткий вывод о частоте доменов в белках изучаемой бактерии.

    Представленность изучаемых доменов в белках Bacillus subtilis

    PFAM ID Bacillus subtilis
    1.    
         

  7. Приведите не менее трёх примеров разных доменных перестроек
  8. Для каждого из доменов заданного белка рассмотрите странички с вариантами доменной организации и подберите наиболее яркие примеры доменных перестроек. Для каждого примера в отчете приведите идентификатор PFAM и название домена, две картинки, иллюстрирующие перестройки, и краткое описание перестройки.

    Пример:
    Домен PF00532 (Peripla_BP_1) встречается в сочетании с разными доменами, причем бывает как на N-, так и на С-конце последовательности.
    AGLR_RHIME:
    B5YAI5_DICT6:

    Чем нетривиальнее пример, тем лучше!! Обратите внимание на однодоменные и многодоменные варианты, на дупликации доменов, на разрывы в последовательности доменов и т.п.

  9. Экспортируйте в формате msf выравнивание-затравку (seed) для N-концевого домена заданного белка. Прикрепите полученный файл к отчету
  10. Сравните описание мотивов в разных БД.
  11. Откройте главную страничку БД InterPro. По идентификатору UniProt вашего белка найдите описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID. Картинку с разметкой всех мотивов вставьте в отчет. В отчете ответьте на следующие вопросы.
    1. Как называется самый короткий мотив? В какой БД он описан? Как называется тип распознающего правила?
    2. Как называется самый длинный мотив? В какой БД он описан? Как называется тип распознающего правила?
    3. Какие структурные подписи интегрированы в InterPro?
    4. Отличаются ли границы структурных доменов от границ доменов Pfam?