Доменная структура белка XYND_BACSU по данным Pfam

Cхема из Pfam:
Начальный желтый участок - сигнальный пептид, занимающий положение с 1 по 26 аминокислоту.
Зеленый участок - это семейство гликозил гидролазы, красный - карбогидратный связывающий модуль
Красные ромбы над зеленым участком - доноры протонов, фиолетовые круги над красным - это металлические лиганды (Кальций; натрий, несмотря на присутствие в белке, не отмечен)
Pfam AC Pfam ID Полное название семейства доменов
(по-русски! и желательно с кратким пояснением)
Положение в последовательности белка XYND_BACSU Клан
1. PF04616 DUF377 Семейство гликозил гидролаз 43 состоит из арабинаназ. 38-362 Клан B Frustosidase (Бета фруктоpидаза) (CL0143), содержит 55 семейства,
2. PF03422 DUF642 Карбогидратный связывающий модуль (6-ая семья) 385-512 Клан GBD (CL0202), содержащее 25 семейств. Полное название: Галактозное связывающее доменоподобное надсемейство.

Glycosyl hydrolases family 43 - 193 вида; CMBM_6 - 143 вида

Представленность домена PF03422 в организмах разных видов

Таксон
Количество белков с доменом PF03422.
Эукариоты Зеленые растения 3
Грибы 16
Животные 1
Остальные эукариоты 1
Бактерии 519
Археи 35

Представленность изучаемых доменов в белках Bacillus subtilis

PFAM ID Bacillus subtilis
1. DUF377 7 белков
2 DUF642 3

С точно такой же организацией лишь один белок: Q6YK38_Bacsu, Эндо-1,4-бета-ксиланаза, по сути выполняющая ту же функцию

На основании данных можно сказать, что домены встречаются довольно редко

Доменные перестройки

  • Домен PF04616 способен к дупликации, а также может находиться как на N, так и на C конце, причем в том числе есть случай, когда этот домен - единственный на белок, и его копии разделены значительным расстоянием. Эта дупликация может быть вызвана геномной перестройкой

  • B5JKS4_9BACT

    C0BUU7_9BIFI

  • Домен PF03422. Домен способен к дупликации, может находиться на обоих концах, способен образовавывать цепочки и вообще располагается кучно

  • O07653_9GAMM

    Q21HB4_SACD2

    Не менее интересен B8GDT4 METPE, в котором цепочка из четырех CBM_6

    Выравнивание-затравка для N-концевого домена
    Данные по Interpro

    Самый короткий мотив - CBM_6 (Затравка PROKAR_LIPOPROTEIN не в счет). База данный - PFAM.

    Самые длинный мотив - Glyco_hydro-43 по базе данных PANTHER

    Структуры представлены 3с7fA (выясненная) и MB Q45071 (предсказанная)

    CBM6 чуть длиннее, чем в PFAM, в PANTHER в Glyco_hydro_43 включена затравка, в отличие от PFAM