Домены. БД Pfam, InterPro.


  1. Исследование доменной структуры белка ACON2_ECOLI

    1. Доменная структура белка по данным Pfam

      C помощью идентификатора UniProt заданного белка найдем на сайте БД Pfam описание его доменной организации. Описание оформлено в следующей табличке:

      Доменная структура белка ACON2_Ecoli по данным Pfam

      Cхема из Pfam:
      Пояснения к схеме
      Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка ACON2_Ecoli Клан
      1. PF11791 Aconitase_B_N N-концевой домен аконитазы B 4-156 Не принадлежит никакому клану
      2. PF06434 Aconitase_2_N N-концевой домен аконитатгидратазы 2;
      обычно связан с доменом аконитазы
      168-382 Принадлежит клану Leu-IlvD (CL0364), содержащему 3 семейства доменов;
      из них 1 с неизвестной функцией (PFAM ID начинается с DUF)
      3. PF00330 Aconitase Аконитаза (аконитатгидратаза);
      домен, катализирующий стерео-специфичную изомеризацию 2-изопропилмалата и 3-изопропилмалата, осуществляя второй этап биосинтеза лейцина;
      встречается в большинстве видов прокариотов и грибов
      464-701 Не принадлежит никакому клану
      4. PF00330 Aconitase Аконитаза (аконитатгидратаза);
      домен, катализирующий стерео-специфичную изомеризацию 2-изопропилмалата и 3-изопропилмалата, осуществляя второй этап биосинтеза лейцина;
      встречается в большинстве видов прокариотов и грибов
      695-818 Не принадлежит никакому клану
    2. Выравнивание-затравка (seed) для N-концевого домена белка ACON2_ECOLI

      В белке ACON2_ECOLI имеются два N-концевых домена (см. таблицу). Было получено выравнивание-затравка (seed) для N-концевого домена аконитазы B (то есть для первого (ближайшего к N-концу) домена). Выравнивание в формате msf было сохранено в файле PF11791_seed.msf и импортировано в GeneDoc для получения изображения. В результате выравнивание выглядит следующим образом:
    3. Сравнение описания доменной структуры в Pfam с описаниями в других БД

      По идентификатору UniProt белка ACON2_ECOLI найдем в БД InterPro описания всех подписей, интегрированных в InterPro, то есть имеющих InterPro ID. В моем случае их оказалось достаточно много. Все они показаны на этой страничке.
      Среди них мне показались наиболее интересными три подписи. Все они получены из БД Gene3D. Выглядят они следующим образом:



      Они имеют следующие InterPro ID (в порядке изображения): IPR015928, IPR015931 и IPR015932. Первая из этих подписей была выбрана потому, что она описывает домен "поворота" аконитатгидратазы, являющийся значимой частью N-концевого домена аконитатгидратазы 2, описанного в Pfam:

      Вторая и третья подписи были выбраны по другим соображениям. Они позволяют подробнее изучить структуру домена аконитазы. Как видно, во второй подписи имеются повторы домена, между которыми располагается домен третьей подписи. Для сравнения со структурными доменами посмотрим на подпись Pfam:

      На ней мы видим, что в середине домена имеется разрыв, после которого следует снова начальный участок домена. Вторая и третья подписи Gene3D объясняют это явление. Дело в том, что домен аконитатгидратазы состоит из трех субъединиц: двух одинаковых альфа-субъединиц (изображенных на второй подписи) и одной бета-субъединицы, расположенной между ними (изображенной на третьей подписи).
      Скорее всего, в процессе эволюции альфа субъединица дуплицировалась, в результате чего образовался домен с новой функцией, получивший название аконитазы.
    4. Сопоставление доменной структуры белка ACON2_ECOLI с его 3D структурой

      Получим изображение 3D-структуры заданного белка, в которой цветом выделены отдельные домены в последовательности. Изображение идентификатора записи pdb 1l5j уже имеется среди готовых картинок. Поэтому его удалось экспортировать:

      Как видно, белок состоит из двух идентичных цепей, в каждой из которых N-концевой домен аконитазы B выделен зеленым цветом, N-концевой домен аконитазы 2 - красным цветом, а домены аконитазы - синим цветом. Из картинки видно (но не так хорошо, как в Jmole), что N-концевые домены соответствуют вполне отдельным компактным частям структуры, причем совпадение этих доменов и соответствующих им структурных доменов почти стопроцентное (только края структурных доменов не входят в состав доменов). Домены аконитазы тоже отчасти соответствуют структурному домену (причем, одному и тому же на каждой цепи (объяснение этого заключается в том, что домен аконитазы состоит из 3 субъединиц (см. предыдущий пункт))), но их совпадение не идеальное (потому что в том же структурном домене расположены участки последовательности, не принадлежащие доменам аконитазы).
  2. Исследование эволюции отдельных доменов

    1. Встречаемость доменов белка ACON2_ECOLI в разных организмах

      Выясним, в организмах скольких видов встречаются белки с каждым из доменов заданного белка. Получаем, что N-концевой домен аконитазы B встречается в 328 видах, N-концевой домен аконитазы 2 - в 347 видах, домен аконитазы - в 972 видах. Внимательнее изучим представленность N-концевого домена аконитазы 2 в организмах разных видов, для чего заполним следующую табличку:

      Представленность домена PF06434 в организмах разных видов

      Таксон
      Количество белков с доменом PF06434
      Эукариоты Зеленые растения 6
      Грибы 0
      Животные 0
      Остальные эукариоты 2
      Бактерии 556
      Археи 1
      Из таблицы очевидно, что белки с этим доменом встречаются, в основном, у бактерий. Это вполне ожидаемо, ведь белок ACON2_ECOLI, в котором этот домен обнаружился, был получен из бактерии Escherichia coli. Среди 8 белков с доменом из эукариот 6 встречаются у низших эукариот (водорослей Bacillariophyta и Chlorophyta) и только 2 - у высших покрытосеменных растений. В целом, этот домен не очень распространен у разных организмов, но у бактерий его встретить можно не так редко.
    2. Встречаемость доменов белка ACON2_ECOLI в разных белках Escherichia coli K12

      Теперь выясним, в скольких белках Escherichia coli K12 встречаются домены белка ACON2_ECOLI. Для этого заполним следующую табличку:

      Представленность изучаемых доменов в белках Escherichia coli (strain K12)

      PFAM ID Количество белков в Escherichia coli (strain K12)
      1. Aconitase_B_N 1 (ACON2_ECOLI)
      2. Aconitase_2_N 1 (ACON2_ECOLI)
      3. Aconitase 4 (ACON2_ECOLI, ACON1_ECOLI, YBHJ_ECOLI, LEUC_ECOLI)
      В бактерии Escherichia coli (strain K12) есть лишь один белок, в котором имеются N-концевые домены аконитазы (B и 2). Это изучаемый белок ACON2_ECOLI. Белков, в котором встречается домен аконитазы, в этой бактерии 4. Причем, только в белке ACON2_ECOLI домена аконитазы в последовательности 2 (2 альфа-субъединицы), в остальных 3 белках представлен лишь один такой домен. Естественно, никаких других белков с такой же доменной организацией, что и ACON2_ECOLI, в бактерии Escherichia coli (strain K12) нет (так как нет других белков с N-концевыми доменами B и 2).
    3. Примеры разных доменных перестроек

      Найдем для каждого домена белка ACON2_ECOLI яркие примеры доменных перестроек в других белках.
      Домен PF11791 (Aconitase_B_N) почти всегда располагается в последовательности вместе с доменом Aconitase_2_N, предшествуя ему. Есть лишь несколько белков с неизвестной функцией, где этот домен встречается в одиночку (см. ниже). Вполне возможно, что это вообще не полная последовательность, а лишь ее часть, впрочем, домен на ней не имеет "обрезанных" краев, так что возможно, что существует и такой белок:
      C0AWC1_9ENTR 
      Располагается он всегда на N-конце. Поэтому для домена Aconitase_B_N перестройки заключаются только в "неполноте" домена с N-конца (см. ниже) (а скорее всего это просто не полная с N-конца последовательность, ведь, как видно из рисунка, домен обрывается прямо на N-конце). Как видно из этих двух примеров, домен может иметь разную длину:
      B9YSL7_ANAAZ 


      Домен PF06434 (Aconitase_2_N) всегда встречается в последовательностях вместе с доменом Aconitase_B_N (сразу после него) и всегда на N-конце. Этот домен никогда не дуплицируется. Длина его примерно постоянна (не таких вариаций, как у N-концевого домена аконитазы B). Его перестройки заключаются в соседстве с разными доменами на C-конце (один из которых - Aconitase):
      B9TA26_RICCO
      Кроме того, домен может быть "обрезан" на N-конце (домен Aconitase_B_N может "налезать" на него):
      Q8KEY9_CHLTE


      Домен PF00330 (Aconitase) - самый богатый в смысле доменных перестроек. Он может встречаться и на С-конце, и на N-конце последовательности (см. разные примеры ниже и выше, включая белок ACON2_ECOLI); может встречаться вместе с различными другими доменами (см. примеры ниже и выше, включая ACON2_ECOLI):
      B8N602_ASPFN
      Домен может обрезаться с одного из концов (см. выше белок Q8KEY9_CHLTE) или с обоих концов (cм. выше белок B8N602_ASPFN); может встречаться в одиночку (см. выше белки Q8KEY9_CHLTE и B8N602_ASPFN) и дуплицироваться (cм. белок ACON2_ECOLI и ниже):
      ACON_MYCAV
      B8MSQ2_TALSN
      Причем, домен может дуплицироваться не только "вплотную" к самому себе, но и через некоторую последовательность (как, например, в белке ACON_MYCAV выше). Это подтверждают данные InterPro. Причем, интересно, что домен, расположенный перед разрывом, состоит из альфа- и бета-субъединиц, в то время как домен, расположенный после разрыва, состоит из альфа-субъединицы. То есть если не обращать внимание на разрыв, домен аконитазы в белке ACON_MYCAV имеет точно такую же структуру, как и в белке ACON2_ECOLI. Структурные домены ACON_MYCAV выглядят так:

Назад