Занятие 12. Эволюционные домены.
БД Pfam, InterPro.
Ваша рабочая директория H:\Term2\Practice12,
в ней храните все рабочие файлы.
Формат отчета HTML-страничка со ссылкой со страницы второго семестра.
Срок — утро дня следующего занятия.
- Опишите доменную структуру
данного вам белка
по данным Pfam.
Откройте главную страничку базы данных
Pfam.
По идентификатору UniProt своего белка найдите описание его доменной организации.
В отчет вставьте табличку следующего вида:
Доменная структура белка XXXX_BACSU по данным Pfam
Cхема из Pfam: |
Пояснения к схеме
|
№ |
Pfam AC |
Pfam ID |
Полное название семейства доменов
(по-русски! и желательно с кратким пояснением) |
Положение в последовательности белка XXXX_BACSU |
Клан |
1. |
PF00218 |
IGPS |
Семейство доменов названо по названию фермента индол-3-глицерофосфатсинтетазы,
фермента, катализирующего четвёртый этап биосинтеза триптофана... |
4–252 |
Клан TIM_barrel (CL0036),
содержит 54 семейства,
у пяти неизвестна функция
(PFAM ID начинается с DUF) |
2. |
| | | | |
- Опишите, как часто и в каких организмах встречаются домены заданного белка
Откройте страничку Pfam с доменной структурой заданного белка.
Щелчок по изображению конкретного
домена откроет страничку с его описанием. Запишите в отчет, в организмах скольких видов
встречаются белки с каждым из доменов заданного белка. Выберите один из доменов
(не рекомендуется брать домены, встречающиеся слишком часто или слишком редко) и откройте
таксономическое дерево PFAM.
По данным для выбранного домена заполните следующую табличку.
В кратком резюме сделайте вывод о распространенности доменов.
Представленность домена PFxxxx в организмах разных видов
Таксон
|
Количество белков с доменом PFxxxxxx.
|
Эукариоты |
Зеленые растения |
|
Грибы |
|
Животные |
|
Остальные эукариоты |
|
Бактерии |
|
Археи |
|
- Определите, в скольких разных белках
Bacillus subtilis встречаются домены, представленные в заданном белке
Откройте страничку с таксономическом деревом Pfam для первого из доменов заданного белка.
С помощью контекстного поиска (<Ctrl+F> в большинстве браузеров) найдите таксон.
Поставьте перед названием
таксона галочку и щелкните по кнопке View graphically в правом меню.
Изучите открывшуюся страничку и занесите результаты в табличку, см. ниже.
Повторите то же для каждого из доменов заданного белка.
Ниже таблички приведите число белков с точно такой же доменной организацией,
что и заданный белок. Сделайте
краткий вывод о частоте доменов в белках изучаемой бактерии.
Представленность изучаемых доменов в белках Bacillus subtilis
№ |
PFAM ID |
Bacillus subtilis |
1. |
|
|
|
|
|
- Приведите не менее трёх примеров разных доменных перестроек
Для каждого из доменов заданного белка рассмотрите странички с вариантами
доменной организации и подберите наиболее яркие примеры доменных перестроек.
Для каждого примера в отчете приведите идентификатор PFAM и название домена,
две картинки, иллюстрирующие перестройки, и краткое описание перестройки.
Пример:
Домен PF00532 (Peripla_BP_1) встречается в сочетании с разными доменами,
причем бывает как на N-, так и на С-конце последовательности.
AGLR_RHIME:
B5YAI5_DICT6:
Чем нетривиальнее пример, тем лучше!!
Обратите внимание на однодоменные и многодоменные варианты, на дупликации доменов,
на разрывы в последовательности доменов и т.п.
- Экспортируйте в формате msf выравнивание-затравку (seed)
для N-концевого домена заданного белка. Прикрепите полученный файл к отчету
- Сравните описание мотивов в разных БД.
Откройте главную страничку БД InterPro.
По идентификатору UniProt вашего белка найдите описание всех подписей (signatures),
интегрированных в InterPro, т.е. имеющих InterPro ID. Картинку с разметкой всех мотивов
вставьте в отчет. В отчете ответьте на следующие вопросы.
- Как называется самый короткий мотив? В какой БД он описан?
Как называется тип распознающего правила?
- Как называется самый длинный мотив? В какой БД он описан?
Как называется тип распознающего правила?
- Какие структурные подписи интегрированы в InterPro?
- Отличаются ли границы структурных доменов от границ доменов Pfam?
|