1. Описание доменной архитектуры белка GUAD_BACSU в соответствии с банком Pfam.
На главной странице Pfam ищем по ID (раздел JUMP TO). НА основании выданных данных можно составить следущую страницу:

Доменная структура белка GUAD_BACSU по данным Pfam

Cхема из Pfam:
fig1
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов
Положение в последовательности белка GUAD_BACSU Клан
1. PF00383 dCMP_cyt_deam_1 Участок связывания цинка цитидин- и деоксицитидилат-деаминазы. Цитидин-деаминаза катализирует гидролиз цитидина, в результате чего образуются уридин и аммиак. Деоксицитидилат-деаминаза гидролизует деоксицитидинмонофосфат в деоксиуридинмонофосфат. Оба фермента связывают цинк, который необходим для их каталитической активности. 1-102 Семейство принадлежит клану CDA (CL0109), в котором, кроме этого, еще 15 семейств, у всех известна функция.

2. Изучение домена PF00383 белка GUAD_BACSU

fig2
Во сколько разных архитектур входит домен? 75
Для какого числа белков, содержащих домен, известна последовательность? 11385
Для какого числа разных белков, содержащих домен, определена пространственная структура (домена или всего белка)? 15
Выравнивание "seed" фрагментов белков, соответствующих домену PF00383_seed.msf


3. Описание доменной архитектуры, в которой присутствует два или более разных домена
Белок GUAD_BACSU включает единственный домен, поэтому проверим, в какие доменные архитектуры входит этот домен (всего архитектур 75).
Выберем, например, эту архитектуру: dCMP_cyt_deam_1, RibD_C x 2

fig3

Изображение выбранной архитектуры из Pfam:

fig4

В разделе Species доступна информация распределении числа последовательностей с рассматриваемым доменом по таксонам. Домен dCMP_cyt_deam_1 содержится в белках 2993 видов , домен RibD_C - 2455 видов. Из-за того, что домены представлены в таком большом количестве видов, интерактивное дерево недоступно, зато есть его текстовые варианты для dCMP_cyt_deam_1 (PF00383) и для RibD_C (PF01872) Используя полученные данные для каждого домена, заполним таблицу представленности домена в организмах разных таксонов.
Таксон Количество встреч в последовательностях с доменом PF00383 Количество встреч в последовательностях с доменом PF01872
Эукариоты Зеленые растения (Viridiplantae) 252 33
Грибы (Fungi) 564 114
Животные (Metazoa) 315 2
Остальные эукариоты 205 27
Археи (Archaea) 121 126
Бактерии (Bacteria) 9816 4455
Вирусы (Viruses) 88 1

Представленность домена PF01872 в организмах различных таксонов намного меньше. Лидирующее место по представленности этого домена так же, как и домена PF08211, занимают Бактерии.

4. Сравнение описания мотивов в разных банках семейств по данным InterPro
На главной странице InterPro ищем по Uniprot ID. Результат поиска - описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.

fig5

На основе полученной информации можно сделать следующие утверждения:

Наверх