Практикум 12. Семейства белковых доменов. PFAM блоки

1. Описание семейства доменов

Для выполнения практикума 11 мною было выбрано семейство белковых доменов Zinc finger, C4 type (two domains).

Name: Double treble clef zinc finger, C4 type

AC Pfam: PF00105

Pfam summary: практически во всех случаях это ДНК-связывающий домен (DBD) ядерного гормонального рецептора. Выравнивание содержит два слишком разных цинковых пальца, чтобы можно было выровнять их друг относительно друга.

Таксономическая распространённость домена: домен встречается исключительно у эукариот.

Таблица 1: Описание семейства белковых доменов Double treble clef zinc finger, C4 type

Информация Комментарий
AC pfam PF00105
ID pfam Double treble clef zinc finger, C4 type
#SEED 26 Число последовательностей в выравнивании SEED
#All 94000 Число всех белков с доменом семейства
#SW 478 Число белков с доменом Swissprot
#architectures 735 Число разных доменных архитектур
#3D 116 Число доменов с известной 3D структурой
Taxonomy
#eukaryota 92908 Число всех белков с доменом семейства в супер-царстве
#archaea 0
#bacteria 0

Почему именно Double treble clef zinc finger, C4 type?

Домен содержит два тандемно (double) расположенных мотива «цинковый палец». И хотя оба мотива имеют схожую структуру (каждый может координировать ион цинка с помощью четырех цистеинов), их аминокислотные последовательности настолько различны, что их невозможно выровнять друг относительно друга, таким образом речь идет о двух одинаковых по функции, но разных по последовательности элементах в составе одного домена.

Структурный мотив treble clef: каждый из пальцев сворачивается в специфическую трехмерную структуру, напоминающую по форме скрипичный ключ - treble clef.

2. Карта локального сходства (dotplot)

Далее было необходимо построить и интерпретировать карту локального сходства двух белков, содержащих мой домен, но различающихся по доменной архитектуре.

Референсный (Query) белок: Q17370

Рисунок 1. Доменная архитектура белка Nuclear hormone receptor family member nhr-47

Белок-мишень (Subject): P37234

Рисунок 2. Доменная архитектура белка Peroxisome proliferator-activated receptor gamma

Таблица 2: Доменные архитектуры выбранных белков

Информация Комментарии
Доменная архитектура 1 PF00105 - PF00104 - PF00104
Белок с архитектурой 1 Q17370 NHR47_CAEEL
Доменная архитектура 2 PF12577 - PF00105 - PF00104
Белок с архитектурой 2 P37234 PPARG_XENLA

Текстовая выдача BLASTP доступна по ссылке.

Рисунок 3. Карта локального сходства

Выравнивание охватывает участки с 11 по 85 а.о. (последовательность Query) по оси Х и со 113 по 186 а.о. (последовательность Subject) по оси Y, соответствующие ДНК-связывающему домену Double treble clef zinc finger, C4 type в белках Q17370 и P37234 соответственно.

Невыровненный фрагмент, который мы видим на графике (выглядит как разрыв линии), в выравнивании соответствует гэпу в последовательности Subject, в позиции 142. В реальности же это может быть как результатом вставки в геноме Query (ось X), так и результатом делеции в геноме Subject (ось Y).

В целом можно сказать, что эти последовательности белковых доменов имеют высокий процент сходства (Identities: 34/75 (45%)). Значение E-value составляет всего 2e-18, что свидетельствует о высокой точности полученных результатов. И в самом выравнивании присутствует всего один гэп. Все это говорит о гомологии у данных последовательностей.

Низкий процент окрытия (Query cover: 16%) показывает, что выровненный участок (74/75 а.о.) составляет лишь небольшую часть от всей длины каждого из белков (поскольку они все-таки отличаются по доменной архитектуре, то и выравниваются хорошо только в области общего домена). Так что речь здесь идет о локальном сходстве.