Практикум 11: Pfam, домен Zn_clus, JalView

Мисюрёва Анастасия | Факультет биоинженерии и биоинформатики МГУ

Домен Zn₂Cys₆ (PF00172) — грибные транскрипционные регуляторы

1. Общая характеристика семейства PF00172 (Zn_clus)

Семейство белков Zn₂Cys₆ (грибные транскрипционные регуляторы)

2. Детальная структура и таксономия домена Zn_clus

Структура

Домен складывается в короткий пучок из двух α-спиралей. В основании — два иона цинка, координированных шестью цистеинами (отсюда название Zn₂Cys₆). Одна из спиралей (обычно первая) длиннее — это распознающая спираль. Она встраивается в большой желоб ДНК, и именно её аминокислоты определяют, на какой сайт белок сядет.

Функции

Сам по себе Zn_clus — это только ДНК-связывающий модуль. Однако почти всегда он идёт в связке с другими доменами: димеризационными доменами (лейциновая молния или длинный α-спиральный линкер) и регуляторными доменами (куда приходят сигнальные молекулы — метаболиты, гем и т.д.). Благодаря модульной конструкции одно семейство (один Zn_clus) управляет разными процессами.

Таксономия

Рисунок 1. Таксономия семейства PF00172

Рисунок 2. Распространенность среди грибных таксонов семейства PF00172.

Подавляющее большинство (≈99%) последовательностей домена Zn_clus принадлежит царству Fungi (грибы). Домен является маркерным для грибов.

Ключевой вывод: Домен Zn_clus — таксономический маркер грибов.

ПолеИнформацияКомментарииПояснения
AC pfamPF00172
ID pfamZn_clusКороткое название домена
#SEED28Число последовательностей в выравнивании SEEDВручную отобранные последовательности.
#All~238 000Число всех белков с доменом семействаВключает полные и частичные последовательности.
#SW~440Число белков с доменом в SwissProt (reviewed)Только вручную аннотированные.
#architectures~2 639Число разных доменных архитектурРазличные комбинации Zn_clus с другими доменами.
#3D~38Число доменов с известной 3D-структуройВключая свободные и в комплексе с ДНК.
#eukaryota~237 997Подавляющее большинствоПочти все принадлежат царству Fungi (грибы)
#archaea0Не обнаруженоДомен отсутствует у архей
#bacteria~3Единичные находкиСкорее всего, артефакты аннотации или контаминация

3. Выравнивание seed домена PF00172 в JalView

Max_Conserved_Block (максимальный блок достоверного выравнивания)

Максимальный блок достоверного выравнивания, включающий фрагменты из всех 28 последовательностей seed-набора без пропусков, находится в позициях 6–13 (по нумерации Jalview). Длина блока составляет 8 аминокислотных колонок. Данный участок содержит высококонсервативный мотив C-X-X-C, в котором два цистеина строго фиксированы и разделены ровно двумя любыми аминокислотными остатками. Этот мотив необходим для координации первого атома цинка в бинуклеарном кластере.

Partial_Block (блок, включающий фрагменты не из всех последовательностей)

Partial_Block расположен в позициях 20–27 выравнивания. В этом участке часть последовательностей имеет пропуски (символы + в консенсусной строке). Данный фрагмент соответствует вариабельной петле между цистеинами C3 и C4. У разных видов грибов длина этой петли варьирует от 5 до 12 аминокислотных остатков, поэтому при выравнивании добавляются пропуски. Это классический пример Partial_Block.

Non_Homologous_Region (участок без достоверного выравнивания)

Негомологичный регион максимальной длины расположен в позициях 34–52. В этом участке наблюдаются множественные пропуски, очень низкая консервативность и отсутствие узнаваемых аминокислотных паттернов. Выравнивание в данной области не может считаться достоверным и не отражает эволюционные связи между последовательностями. Структурно этот регион соответствует C-концевой области домена Zn_clus, расположенной за пределами цинк-связывающего кластера.

ПараметрИнформацияКомментарии
Выравнивание seed28 последовательностей, 52 колонкиSeed-набор Pfam, загружен через Jalview
МДБ-all6–13Длина 8 колонок, без пропусков, цистеиновый мотив
100% консервативные колонки в МДБ-all6:C, 13:CЦистеин (C) у всех 28 последовательностей
МДБ-notAll20–33Вариабельная петля между цистеинами. Блок содержит пропуски у части последовательностей
100% консервативные колонки в МДБ-notAll30:C, 33:CКонсервативность частичная
Non_Homologous_Region43–52C-концевая область. Множественные пропуски, низкая консервативность
Скачать проект JalView (.jvp)

4. Dotplot двух последовательностей с разной доменной архитектурой

ПараметрИнформацияКомментарии
Доменная архитектура 1Zn_clus (PF00172) + Gal4_middle (PF01767)Регуляторный домен, характерный для GAL4-подобных белков
Белок с архитектурой 1GAL4_YEAST (P04386)Транскрипционный активатор генов метаболизма галактозы
Доменная архитектура 2Zn_clus (PF00172) + Leu_zip (PF07716) + fungal_TF_MHR (PF11939)Лейциновая молния (димеризация) + большой регуляторный домен
Белок с архитектурой 2PUT3_YEAST (P25502)Транскрипционный активатор генов метаболизма пролина

Оба белка относятся к грибным транскрипционным регуляторам и содержат ДНК-связывающий домен Zn_clus (PF00172). Однако их C-концевые регуляторные области различаются: у GAL4_YEAST это домен Gal4_middle, отвечающий за активацию транскрипции в ответ на галактозу, а у PUT3_YEAST — лейциновая молния (Leu_zip) для димеризации и большой регуляторный домен fungal_TF_MHR, участвующий в ответе на пролин. Эти различия в архитектуре обусловливают разную функциональную специализацию белков.

Dotplot (NCBI BLAST)

Dotplot построен с помощью NCBI BLASTp (Aligner two or more sequences). На графике отчётливо видна протяжённая диагональная линия в N-концевой части последовательностей, соответствующая общему домену Zn_clus. После этой области диагональ обрывается, что отражает различия в C-концевых регуляторных доменах.

Рисунок 3. Точечная диаграмма (dotplot) для GAL4_YEAST и PUT3_YEAST.

Dotplot GAL4 vs PUT3

Интерпретация: Наличие диагональной линии в начале указывает на высокую гомологию N-концевых участков, что соответствует общей функциональной роли в связывании ДНК. Отсутствие диагонали после ~70 аминокислот подтверждает независимую эволюцию регуляторных доменов.


Отчёт по практикуму 11 | Мисюрёва Анастасия | 2026