1. Описание доменной архитектуры белка GUAD_BACSU в соответствии с банком Pfam.
На главной странице Pfam ищем по ID (раздел JUMP TO). НА основании выданных данных можно составить следущую страницу:
Доменная структура белка GUAD_BACSU по данным Pfam
Cхема из Pfam: |
|||||
Пояснения к схеме |
|||||
№ | Pfam AC | Pfam ID | Полное название семейства доменов |
Положение в последовательности белка GUAD_BACSU | Клан |
1. | PF00383 | dCMP_cyt_deam_1 | Участок связывания цинка цитидин- и деоксицитидилат-деаминазы. Цитидин-деаминаза катализирует гидролиз цитидина, в результате чего образуются уридин и аммиак. Деоксицитидилат-деаминаза гидролизует деоксицитидинмонофосфат в деоксиуридинмонофосфат. Оба фермента связывают цинк, который необходим для их каталитической активности. | 1-102 | Семейство принадлежит клану CDA (CL0109), в котором, кроме этого, еще 15 семейств, у всех известна функция. |
2. Изучение домена PF00383 белка GUAD_BACSU
Во сколько разных архитектур входит домен? | 75 |
Для какого числа белков, содержащих домен, известна последовательность? | 11385 |
Для какого числа разных белков, содержащих домен, определена пространственная структура (домена или всего белка)? | 15 |
Выравнивание "seed" фрагментов белков, соответствующих домену | PF00383_seed.msf |
3. Описание доменной архитектуры, в которой присутствует два или более разных домена
Белок GUAD_BACSU включает единственный домен, поэтому проверим, в какие доменные архитектуры входит этот домен (всего архитектур 75).
Выберем, например, эту архитектуру: dCMP_cyt_deam_1, RibD_C x 2
Изображение выбранной архитектуры из Pfam:
В разделе Species доступна информация распределении числа последовательностей с рассматриваемым доменом по таксонам. Домен dCMP_cyt_deam_1 содержится в белках 2993 видов , домен RibD_C - 2455 видов. Из-за того, что домены представлены в таком большом количестве видов, интерактивное дерево недоступно, зато есть его текстовые варианты для dCMP_cyt_deam_1 (PF00383) и для RibD_C (PF01872) Используя полученные данные для каждого домена, заполним таблицу представленности домена в организмах разных таксонов.
Таксон | Количество встреч в последовательностях с доменом PF00383 | Количество встреч в последовательностях с доменом PF01872 | |
Эукариоты | Зеленые растения (Viridiplantae) | 252 | 33 |
Грибы (Fungi) | 564 | 114 | |
Животные (Metazoa) | 315 | 2 | |
Остальные эукариоты | 205 | 27 | |
Археи (Archaea) | 121 | 126 | |
Бактерии (Bacteria) | 9816 | 4455 | |
Вирусы (Viruses) | 88 | 1 |
Представленность домена PF01872 в организмах различных таксонов намного меньше. Лидирующее место по представленности этого домена так же, как и домена PF08211, занимают Бактерии.
4. Сравнение описания мотивов в разных банках семейств по данным InterPro
На главной странице InterPro ищем по Uniprot ID. Результат поиска - описание всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.
На основе полученной информации можно сделать следующие утверждения:
- Самый короткий мотив - CYT_DCMP_DEAMINASES. InterPro ID: IPR016192. Мотив описан в банке PROSITE pattern.
- Самый длинный мотив - Cytidine_deaminase-like. InterPro ID: IPR016193. Мотив описан в банке SuperFamily.
- В InterPro также интегрированы следующие структурные подписи: 1wkqA, 1wkqB, 1wkqA00 (3.40.140.10) и d1wkqa_ (c.97.1.2).
- Границы структурных доменов шире, по сравнению с границами доменов Pfam (1 - 156 против 2 - 101, 53 - 90 в Pfam).
Наверх