Воспользуемся поиском "Jump to", чтобы найти домены белка YXIM в Pfam по его идентификатору. В белке выделено три участка - сигнальная, автоматически созданный домен, обрывок домена GDSL липаз. Подробная информация приведена в таблице 1.
Таблица 1. Информация о доменах белка YXIM_BACSU
Схема из Pfam: |
|||||
Пояснения к схеме | |||||
№ | Pfam AC | Pfam ID | Полное название семейства доменов | Положение в последовательности белка YXIM_BACSU | Клан |
1 | - | sig_p | Сигнальная последовательность | 1-25 | - |
2 | PB001453 | - | Семейство создано автоматически Pfam B | 26-115 | - |
3 | P42304 | Lipase_GDSL_2 | Семейство GDSL-липаз, названо по мотиву липаз широкой активности | 182-366 | Семейство относится к клану SGNH_hydrolase (CL0264), куда входят ещё 8 семейств, функция 2 неизвестна |
Домен входит в 260 архитектур, для 11620 белков известны последовательности, для 16 разных белков установлены пространственные структуры.
Выравнивание "seed" фрагментов белков, соответствующих домену, в текстовом формате можно найти по этой ссылке.
Исследуем встречаемость доменов GDSL-липаз и пектин эстераз, которые встречаются вместе в 40 архитектурах (см. рис.1). Информация, полученная на сайте Pfam приведена в таблице 2.
Рис.1. Архитектура, включающая домены Lipase_GDSL_2 и Pectinesterase |
Таблица 2. Представленность доменов Lipase_GDSL_2 и Pectinesterase в организмах разных таксонов
Таксон | Количество белков с доменом Lipase_GDSL_2 | Количество белков с доменом Pectinesterase | |
Эукариоты | Зелёные растения | 76 | 1240 |
Грибы | 554 | 174 | |
Животные | 209 | 13 | |
Остальные эукариоты | 71 | 57 | |
Археи | 40 | 4 | |
Бактерии | 10432 | 981 | |
Вирусы | 60 | 0 |
В базе данных InterPro хранится информация о различных семействах белков. По идентификатору белка найдём подписи, интегрированные в InterPro (см. рис.2)
Рис.2. Расположение доменов, интегрированных в InterPro |
Как видим, интегрирована всего одна запись, остальные относятся к no IPR (no InterPro Reference). Мотив эстераз типа SGNH-гидролаз является самым длинным и самым коротким одновременно, описан в банке CATH (G3DSA:3.40.50.1110). Структурных подписей не интегрировано.