Банки Pfam и InterPro

Доменная архитектура белка YXIM_BACSU

Воспользуемся поиском "Jump to", чтобы найти домены белка YXIM в Pfam по его идентификатору. В белке выделено три участка - сигнальная, автоматически созданный домен, обрывок домена GDSL липаз. Подробная информация приведена в таблице 1.

Таблица 1. Информация о доменах белка YXIM_BACSU

Схема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности белка YXIM_BACSU Клан
1 - sig_p Сигнальная последовательность 1-25 -
2 PB001453 - Семейство создано автоматически Pfam B 26-115 -
3 P42304 Lipase_GDSL_2 Семейство GDSL-липаз, названо по мотиву липаз широкой активности 182-366 Семейство относится к клану SGNH_hydrolase (CL0264), куда входят ещё 8 семейств, функция 2 неизвестна

Домен GDSL-липаз

Домен входит в 260 архитектур, для 11620 белков известны последовательности, для 16 разных белков установлены пространственные структуры.

Выравнивание "seed" фрагментов белков, соответствующих домену, в текстовом формате можно найти по этой ссылке.

Встречаемость доменов в разных таксонах

Исследуем встречаемость доменов GDSL-липаз и пектин эстераз, которые встречаются вместе в 40 архитектурах (см. рис.1). Информация, полученная на сайте Pfam приведена в таблице 2.

Рис.1. Архитектура, включающая домены Lipase_GDSL_2 и Pectinesterase

Таблица 2. Представленность доменов Lipase_GDSL_2 и Pectinesterase в организмах разных таксонов

Таксон Количество белков с доменом Lipase_GDSL_2 Количество белков с доменом Pectinesterase
Эукариоты Зелёные растения 76 1240
Грибы 554 174
Животные 209 13
Остальные эукариоты 71 57
Археи 40 4
Бактерии 10432 981
Вирусы 60 0

Сравнение описания мотивов в разных банках семейств по данным InterPro

В базе данных InterPro хранится информация о различных семействах белков. По идентификатору белка найдём подписи, интегрированные в InterPro (см. рис.2)

Рис.2. Расположение доменов, интегрированных в InterPro

Как видим, интегрирована всего одна запись, остальные относятся к no IPR (no InterPro Reference). Мотив эстераз типа SGNH-гидролаз является самым длинным и самым коротким одновременно, описан в банке CATH (G3DSA:3.40.50.1110). Структурных подписей не интегрировано.