Сравнение доменов SCOP/SCOPe, ECOD, CATH и Pfam

Выбор белка

Для сравнения границ доменов, полученных из разных источников, была выбрана пируват киназа кролика - PDB код 1PKN. Общий вид структуры приведён на рис. 1.

Рис. 1. Структура пируват киназы кролика,
окраска по элементам вторичной структуры.

SCOP

Изначально иерархическая классификация белков в этой базе данных проводилась вручную, однако теперь используются и компьютерные методы. SCOP определяет три домена в рассматриваемой структуре. Информация в таблице ниже.

Class All beta proteins Alpha and beta proteins (a/b) Alpha and beta proteins (a/b)
Fold PK beta-barrel domain-like TIM beta/alpha-barrel Pyruvate kinase C-terminal domain-like
Superfamily PK beta-barrel domain-like Phosphoenolpyruvate/pyruvate domain PK C-terminal domain-like
Family Pyruvate kinase beta-barrel domain
[b.58.1.1]
Pyruvate kinase
[c.1.12.1]
Pyruvate kinase, C-terminal domain
[c.49.1.1]
Координаты 116-217 218-395 396-530

ECOD

Отличие ECOD от других предсказателей доменов в том, что здесь учитываются эволюционные отношения белков. Данный сервис определяет в структуре 1PKN 3 домена, информация о них приведена ниже.

Domain ID e1pknA4 e1pknA3 e1pknA1
X Group Name cradle loop barrel TIM beta/alpha-barrel Other Rossmann-like structures with the crossover
H Group Name RIFT-related TIM barrels PK C-terminal domain-like
T Group Name PK beta-barrel domain-like TIM barrels PK C-terminal domain-like
Координаты 116-217 12-115, 218-395 396-530

CATH

CATH также имеет собственную иерархию белковых доменов, классификация проводится автоматически. В базе данных CATH аннотировано также три домена. Информация о них - в таблице ниже.

Class Mainly Beta Alpha Beta Alpha Beta
Architecture Beta Barrel Alpha-Beta Barrel 3-Layer(aba) Sandwich
Topology M1 Pyruvate Kinase; Domain 3 TIM Barrel Pyruvate Kinase; Chain: A, domain 1
Homologous Superfamily PK beta-barrel domain-like Phosphoenolpyruvate-binding domains -
Координаты 116-218 42-115, 219-384 12-41, 385-529

Pfam

Pfam предсказывает домены в белке, используя для каждого известного домена множественное выравнивание последовательностей и производя поиск с помощью HMM. Предсказание этого сервиса отличается от предыдущих - доменов всего два. Первый и второй домены из предыдущих предсказаний здесь объелинены в один. Зато здесь показаны сайты связывания разных ионов металлов (кружки на картинке).



Домен PK (PF00224) PK_C (PF02887)
Описание Pyruvate kinase, barrel domain Pyruvate kinase, alpha/beta domain
Координаты 42-395 410-528

Выводы

Границы первого домена SCOP, ECOD и CATH определили почти одинаково. Предсказания второго и третьего доменов уже не на столько похожи - ECOD и CATH добавляют дополнительные фрагменты. Pfam объединяет первые два домена в один, суммарные границы ближе всего к границам CATH. Во втором домене, предсказанном Pfam, отсутствует около 15 остатков, причисленных другими сервисами к этому домену. Вероятно, такие значительные отличия вызваны тем, что Pfam предсказывает домены только по последовательности белка.