Эволюционные домены. БД Pfam, InterPro.

  1. Доменная структура белка IDH_BACSU по данным Pfam.
    Поскольку в моём белке оказался только один домен, задание выполнено на примере Q4WD29_ASPFU - он также имеет домен Iso_dh.

    Cхема из Pfam (для Q4WD29_ASPFU):
    Зелёным показан домен Iso_dh,
    Красным - Isochorismatase,
    Ромбиками обозначены активные сайты.
    Пояснения к схеме
    Pfam AC Pfam ID Полное название семейства доменов
    Положение в последовательности белка Q4WD29_ASPFU Клан
    1. PF00180 Iso_dh Семейство доменов названо по названию фермента изоцитратдегидрогиназы, одного из главных ферментов в карбогидратном метаболизме, катализирует окислительное декарбоксилирование изоцитрата в аьфа-кетоглутарат. 7–357 Клан Iso_DH (CL0270), содержит 5 семейств:
    FA_synthesis
    IDH
    Iso_dh
    PdxA
    PTA_PTB
    2. PF00857 Isochorismatase Семейство доменов названо по названию фермента 2,3-дигидро-2,3-дигидроксибензоат синтазы,
    фермента, катализирующего превращение изохоризмата в 2,3-дигидроксибензоат и пируват в присутствии воды.
    387–563 клана нет.


  2. Описание доменов.
    Iso_DH можно встретить у 1202 видов. Isohorismatase - у 826. Рассмотрим первый домен, т.к. он все-таки является определяющим в моем белке. Представленность домена PF00180 в организмах разных видов:

    Таксон
    Количество белков с доменом PF00180.
    Эукариоты Зеленые растения 77
    Грибы 85
    Животные 18 Euglenozoa
    149 Metazoa
    3 Amoebozoa
    Остальные эукариоты 20 Alveolata
    3 Stramenopiles
    1 Rhodophyta
    1 Choanoflaellida
    1 Rhizaria
    1 Parabasalidea
    Бактерии 1417
    Археи 72


    Интересно, что данный домен в основном всречается в паре с другими доменами, а случаи, когда он образует целый белок, составляют около 30% всех вариантов архитектур. Дупликации есть, например, LEU3_AZOVI. В большинстве вариантов Iso_DH идёт первым.
  3. Представленность изучаемых доменов в белках Bacillus subtilis.
    PFAM ID Bacillus subtilis
    1 Iso_dh 3
    2 Isochorismatase 6
  4. Домен P39126 (Iso_DH) встречается в сочетании с разными доменами, причем бывает как на N-, так и на С-конце последовательности:
    LEU3_AZOVI
    A1WZE1_HALHL
    B6QVL8_PENMQ
    Q567A6_DANRE
  5. Выравнивание-затравка (seed) для N-концевого домена заданного белка в формате msf
  6. Сравнение и описание мотивов разных БД:

    1. Самый короткий мотив: PS00470. Описан в ExPASy Proteomics Server. Тип распознающего правила называется Accession number (AC).
    2. Самых длинных мотивовдва: G3DSA:3.40.718.10 и SSF53659. Описаны в CATH Protein Structure Classification и в Superfamily 1.73 HMM library and genome assignments server соответственно. Типы распознающего правила называются CATH Code (Classification Lineage) и SCOP hierarchy.
    3. Структурные подписи, интегрированные в InterPro:

    4. Все представленные варианты содержат только по одному домену, и отличаются определением границ.

© Anastasia Maslova, 2010