Проверка умений 5. Сравнение доменов SCOP и Pfam.
Для работы была выбрана структура пируватдегидрогеназы 1A3W. Обычно пируватдегидрогеназы - многодоменные белки. Для проявления ферментативной активности им нужно собираться в тетрамеры. Следовательно, как минимум, у таких белков должен быть домен для белок-белкового взаимодействия и домен с активным центром.
Это предположение оправдалось, выбранная пируватдегидрогеназа оказалась мультидоменным белком (описано ниже). Рассмотрим цепь A структуры 1A3W. Цепь B - симметричная, результаты для неё будут такими же.

Табл. 1 - Аннотация доменов структуры 1A3W:A в различных базах данных:
База Количество доменов Границы доменов Название домена Характеристика
SCOP 3 88-188 d1a3wa1 Класс: полностью b
Укладка, суперсемейство, семейство: пируват-киназный (PK) b-баррель
189-366 d1a3wa2 Класс: a/b
Укладка TIM b/a-баррель
Суперсемейство: фосфоенолпируват/пируватный домен
Семейство: пируваткиназа
357-500 d1a3wa3 Класс: a/b
Укладка, суперсемейство, семейство: пируваткиназный C-концевой домен
CATH 3 88-189 1a3wA03 Класс: преимущественно b
Архитектура: b-баррель
Топология: домен 3 пируваткиназы M1
Суперсемейство: PK b-баррель
19-87 190-355 1a3wA02 Класс: ab
Архитектуры: ab-баррель
Топология: TIM-баррель
Суперсемейство: ФЕП-связывающий домен
2-18 356-498 1a3wA01 Класс: ab
Архитектура: aba-сандвич
топология: домен 1 ПК
Pfam 2 18-365 PK Домен-баррель из ПК
379-499 PK_C a/b-домен из ПК




Аннотация CATH заметно отличается от остальных тем, что включает домены, составленные из различных фрагментов цепи. Полипептидная цепь в 1A3W сложена в пространстве так, что N- и C- концы оказываются расположенными близко. Упрощенно можно представить полипептидную шпильку, концы которой совместно образуют два домена: TIM-баррель и aba-сендвич, а середина - b-баррель. Только CATH указывает эту особенность укладки.
Довольно странно, что SCOP не умеет искать разрывные по цепи структурные домены.

Вообще, аннотация CATH покрывает почти всю полипептидную цепь, в отличие от аннотации SCOP (серым выделены неаннотированные участки). В аннотации CATH отсутствуют C-концевые аминокислоты, а в аннотации SCOP - и концевые остатки, и последовательности между доменами.

Аннотация Pfam выделяет не 3, а всего два домена (объединяет TIM и b-баррели в один домен PK). Аннотация Pfam производится по последовательностям: скорее всего, в этом и есть причина различий. Возможно, в выравниваниях последовательностей фрагмент 18-365 является однородным и консервативным, так что с точки зрения последовательности нет основания разделять этот фрагмент на два.
Вообще, если смотреть другие возможные архитектуры в Pfam, включающие домен PK, можно найти примеры, где этот домен разорван или представлен только одной/другой половиной. Поэтому странно, что два фрагмента этого домена (которые структурно хорошо различимы, разделены у некоторых организмов линкерами и даже представлены по-одиночке) не выделены отдельно.