Практикум 3. UniProt

Полиэтилентерефталат гидролаза

Полиэтилентерефталат гидролаза (ПЭТФаза) - фермент бактерии Ideonella sakaiensis, способный расщеплять полиэфирный пластик. Он имеет типичную α/β-гидролазную структуру и состоит из шести α-спиралей и восьми β-слоев. Щель активного центра ПЭТФазы шире, чем у других известных белков со схожей структурой и функцией. Предположительно, такое строение активного центра необходимо для связывания кристаллических полиэфиров. Также, по сравнению с другими схожими белками, у ПЭТФазы гидрофобная поверхность, прилегающая к активному центру, расширена. Поверхность фермента сильно поляризована, однако пока неизвестно, какую роль играет это свойство. ПЭТФаза имеет два дисульфидных мостика, один из которых находится в активном центре. Предположительно, мостик может увеличивать стабильность активного центра. Сайт связывания ПЭТФазы характеризуется очень гибкими и длинными ароматическими цепями (Austin et al., 2018).

ПЭТФаза синтезируется бактериями Ideonella sakaiensis, открытыми японскими учеными в 2016 году . Эти бактерии используют ПЭТФ как источник энергии и углерода для роста. Они расщепляют ПЭТФ до моно(2-гидроксиэтил)терефталевой кислоты и небольшого количества терефталевой кислоты и бис(2-гидроксиэтил)терефталевой кислоты в качестве побочного продукта. Далее другой фермент, также выделяемый I. sakaiensis, расщепляет моно(2-гидроксиэтил)терефталевую кислоту до мономеров, терефталевой кислоты и этиленгликоля (Yoshida et al., 2016). Данная бактерия имеет очень важное экологическое значение, так как способна расщеплять ПЭТФ.

Таблица 1. Информация о белке
раздел UniProtKB Swiss-Prot
UniProt ID PETH_IDESA
UniProt AC A0A0K8P6T7
EMBL AC BBYR01000074
PDB ID list of PDB ID
длина 290 AA
молекулярная масса 30247 Da
рекомендуемое UniProt название Poly(ethylene terephthalate) hydrolase
Длина участка с известной стуктурой ~260 AA

Результаты поисковых запросов к UniProt

Таблица 2. Расширенный поиск UniProt
Запрос Результаты запроса
name:"poly ethylene terephthalate hydrolase" NOT id:A0A0K8P6T7 белки со схожим описанием (DE) в других организмах
11 результатов
family:"ab hydrolase superfamily" organism:"ideonella sakaiensis" NOT id:A0A0K8P6T7 другие α/β-гидролазы Ideonella sakaiensis
3 результата
NOT a0a0k8p6t7 annotation:(type:function "poly ethylene terephthalate") другие белки, связанные с ПЭТФ
1 результат
Кластеры UniRef
a0a0k8p6t7 AND identity:0.5 кластер UniRef50 (ID: UniRef50_A0A0K8P6T7)
26 записей
a0a0k8p6t7 AND identity:0.9 кластер UniRef90 (ID: UniRef90_A0A0K8P6T7)
3 записи
a0a0k8p6t7 AND identity:1.0 кластер UniRef100 (ID: UniRef100_A0A0K8P6T7)
2 записи

Как видно из результатов поисковых запросов, существует не так много белков со схожей функцией, то есть ПЭТаз (11 результатов). Причем все они выделяются бактериями. Если же говорить о белках I. sakaiensis, помимо ПЭТазы, α/β-гидролазами также являются еще 3 белка. В разложении ПЭТ наравне с ПЭТазой участвует МЭТаза, расщепляющая моно(2-гидроксиэтил)терефталевую кислоту до мономеров.

Кластеры UniRef

В кластер UniRef50 входит 26 записей. Белки кластера принадлежат 5 различным организмам, все они являются бактериями. Примечательно, что белков, разлагающих ПЭТ, помимо самой ПЭТазы в кластере нет. Из результатов запроса можно сделать вывод, что белки, схожие с ПЭТазой, не распространены, вырабатываются только бактериями и, по-видимому, выполняют специфические функции. Также, получается, другие белки, гидролизирующие ПЭТ, имеют последовательность, заметно отличающуюся от ПЭТазы I. sakaiensis.

Кластер UniRef90 содержит 3 записи. Все они являются ПЭТазами I. sakaiensis.

В кластере UniRef100 2 записи, представляющие собой ПЭТазы I. sakaiensis.

Во всех кластерах UniRef изучаемый мной белок является репрезентативной последовательностью, то есть она наиболее хорошо аннотирована и по ней удобнее всего изучать данный белок. Однако эта последовательность не является сидом, что означает, что она не самая длинная в кластере.

Сравнение протеомов

Таблица 3. Сравнение протеомов
протеом Ideonella sakaiensis протеом Thalassocella blandensis
ID протеома
UP000037660 UP000380825
количество белков
5,527 4,758
количество белков в Swiss-Prot
2 0
трансмембранные белки
annotation:(type:transmem) AND organism:"Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) [1547922]" AND proteome:up000037660
930 результатов
organism:"Thalassocella blandensis [2584524]" proteome:up000380825 annotation:(type:transmem)
987 результатов
ферменты
ec:* AND organism:"Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) [1547922]" AND proteome:up000037660
1,471 результатов
ec:* AND organism:"Thalassocella blandensis [2584524]" AND proteome:up000380825
1,537 результатов
EC 3.1.1 (гидролазы сложных эфиров карбоновых кислот)
ec:3.1.1.* AND organism:"Ideonella sakaiensis (strain NBRC 110686 / TISTR 2288 / 201-F6) [1547922]" AND proteome:up000037660
16 результатов
ec:3.1.1.* AND organism:"Thalassocella blandensis [2584524]" AND proteome:up000380825
28 результатов

В качестве референсного протеома я выбрала протеом Thalassocella blandensis. Мне было интересно сравнить протеом этой бактерии с протеомом I. sakaiensis, так как у нее тоже есть схожий фермент, расщепляющий ПЭТ. Thalassocella blandensis так же как и I. sakaiensis является грамотрицательной протеобактерией

Как можно видеть, результаты вполне сравнимые: трансмембранные белки составляют 17% от всех белков I. sakaiensis и 21% от белков T. blandensis; ферменты составляют 27% протеома I. sakaiensis и 32% протеома T. blandensis. Белков, схожих с ПЭТазой по выполняемой функции (гидролаза сложных эфиров карбоновых кислот) в обоих протеомах не так много (меньше одного процента).