Практикум 7(8).

Изучение белка средствами UniProt


Малил-КоА лиаза – фермент, играющий ключевую роль в этилмалонил-коА пути синтеза ацетата, который впервые был найден у Cereibacter sphaeroides [1]. Он катализирует обратимую реакцию конденсации глиоксилата и ацетил-коА в L-малил-коА, и обратимую реакцию конденсации глиоксилата и пропионил-коА в бета-метилмалил-коА[2]. Примечательность ферментов этого пути синтеза в том, что они могут быть активны при росте практически на любом источнике углерода, в то время как типичный глиоксилатный цикл требует, чтобы его ферменты были индуцированы с помощью ацетата[3].

Cereibacter sphaeroides – представители группы несерных (не образуют внутри своих клеток свободной серы[4]) пурпурных бактерий, аноксигенных фототрофных (факультативно) организмов, активно-использующихся для получения продуктов биологического производства [5]. Также являются многообещающими объектами для производства водорода[6]

Благодаря записи в uniprot, о малил-КоА-лиазе можно узнать следующее:

Его идентификатор MCAL_CERS4. При этом он имеет 2 кода доступа: Q3J5L6, B8XVS9, из которых действующим на данный момент является первый. Исходя из истории “входной информации” можно выяснить, что B8XVS9 был объединен в Q3J5L6 08.02.2011 (тогда запись была внесена в Swiss-Prot ); а id менялся 2 раза: в связи с внесением последовательности в Swiss-Prot, и в связи с переименованием организма, которому пренадлежит белок, с Rhodobacter sphaeroides на Cereibacter sphaeroides[7].

Имеются 2 записи в PDB, отражающих пространственные структуры: 4L9Y – с разрешением в 2.10 Å , 4L9Z – с разрешением в 2.01 Å.

Что касается кластеров, то в UniRef100 содержится 4 записи: 1 из UniParc (является seedом) и 3 из swissprot. Все записи принадлежат разным штаммам организма Cereibacter sphaeroides.

В UniRef90 содержится 55 записей: 23 из UniParc, 4 – swissprot, 30 – TrEMBL. UniRef50 содержится 1252 записей: 408 из UniParc, 6 - swissprot, 715 – TrEMBL.

Из запросов стало известно, что ферменты того же класса, что и Малил-КоА лиаза (ec 4.1.3.24 или ec 4.1.3.25) больше всего распространены у бактерий (691 результат), но также есть у архей и эуархонтоглир (14 и 3 результатов соответственно). Все 713 результатов запроса имеют каталитическую активность: малат-синтазную активность, гидролазную, лиазную. И один результат свидетельствует о лигазной активности. Интересно, что 4 белка, исходя из результата запроса, могут быть интегральным компонентом мембраны (1 белок, чье существование предсказано с помощью гомологии) или белком митохондрий у эуархонтоглир (существование белков “надежно доказано” ).

Поиск всех лиаз среди Cereibacter sphaeroides показал, что в этой группе организмов встречаются следующие классы ферментов: ферменты, отвечающие за перенос алкильных или арильных групп (ec 2.5.1. - , 2 результата), ДНК-гликозилазы семейства FPG (EC 3.2.2.23, 8 результатов) и собственно лиазы, выполняющие разные функции (EC 4.-.-.-, 96 результатов).

Поиск по семейству альдолаз hpch/hpai , к которому принадлежит рассматриваемая малил-коА лиаза, внутри организмов одного штамма Cereibacter sphaeroides (ATCC 17023), показал, что к нему относятся малил-коА лиаза и малил-коА тиоэстераза (их существование надежно доказано), а также 2 белка другой функции, чье существование предсказано исходя из гомологии.

Выбор и сравнение протеомов.

Для бактерии Cereibacter sphaeroides (штамм ATCC 17023) был выбран ее референсный протеом с идентификатором UP000002703, его CPD-статус – standart, большинству групп ортологичных генов был присвоен статус Single. Содержит 4285 белков.

В качестве протеома-сравнения был выбран референсный протеом Rhodobacter capsulatus (штамм ATCC BAA-309) с идентификатором UP000002361, CPD-статусом – standart. Большинству групп ортологичных генов был присвоен статус Single. Содержит 3632 белков.

2 эти бактерии относятся к группе Rhodobacteraceae. Обе являются несерными пурпурные бактериями со схожими характеристиками. Но, в отличии от Cereibacter sphaeroides, Rhodobacter capsulatus имеет ICL (изоцитрат-лиазную) активность и, благодаря этому способна использовать как этил-малонил-коА путь синтеза ацетата, так и глиоксилатный путь[6].

Скачивание протеомов было выполнено с помощью команд:

wget 'https://www.uniprot.org/uniprot/?query=proteome:up000002703&format=txt&compress=yes' -O UP000002703.swiss.gz

wget 'https://www.uniprot.org/uniprot/?query=proteome:up000002361&format=txt&compress=yes' -O UP000002361.swiss.gz

Сравнение протеомов по представленности определенных групп белков:

Чтобы узнать соотношения определенных групп белков, были составлены следующие запросы:

запрос для трансмембранных белков Cereibacter sphaeroides:

annotation:(type:transmem) AND proteome:up000002703

запрос для трансмембранных белков Rhodobacter capsulatus:

annotation:(type:transmem) AND proteome:up000002361

запрос для ферментов Cereibacter sphaeroides:

ec:* AND proteome:up000002703

запрос для ферментов Rhodobacter capsulatus:

ec:* AND proteome:up000002361

Cereibacter sphaeroides общее кол-во swiss-prot "ненадежные"/малоизученные Rhodobacter capsulatus общее кол-во swiss-prot "ненадежные"/малоизученные
трансмембранные 835 46 (5,5%) существование предсказано или следует из гомологии 811 (33 аннотированных) 97,13% трансмембранные 679 30 (4,4%) существование предсказано или следует из гомологии 662 (14 аннотированных) 97,50%
"probable" 12 (0 reviewed) 1,44% "probable" 14 (4 аннотированных, 3 Evidence at protein level) 2,06%
неохарактеризованные белки 147(0 аннотированных, 2 Evidence at protein level) 17,60% неохарактеризованные белки 101 (0  аннотированных) 14,87%
доля всех найденных по запросу белков 19,49% "DUF" 6(0 аннотированных) 0,72% доля всех найденных по запросу белков 19% "DUF" 2 (0 аннотированных) 0,29%
ферменты 1183 303 (25,6%) существование предсказано или следует из гомологии 1146 (280 аннотированных) 96,87% ферменты 1320 70 (5,3%) существование предсказано или следует из гомологии 1285( 45 аннотированных) 97,35%
"probable" 6 (4 аннотированных) 0,51% "probable" 8 (2 аннотированных) 0,61%
неохарактеризованные белки 0 0 неохарактеризованные белки 0 0
доля всех найденных по запросу белков 32,57% "DUF" 0 0 доля от всех найденных по запросу белков 36,34% "DUF" 0 0
таб. 1. сравнение количества трансмембранных белков и ферментов

Из таблицы видно, что трансмембранные белки Cereibacter sphaeroides и Rhodobacter capsulatus можно назвать изученными и аннотированными в равной степени.

А ферменты обоих организмов являются более изученными чем трансмембранные белки. Сильнее всего это видно по количеству аннотированных ферментов Cereibacter sphaeroides и отсутствию “неохарактеризованных” ферментов в протеомах.

В обоих организмах доля ферментов выше чем доля трансмембранных белков, согласно результатам запросов.

Поскольку Cereibacter sphaeroides и Rhodobacter capsulatus можно сравнить по возможности синтеза ацетата по этилмалонил-коА пути и наличию или отсутствию ферментов для глиоксилатного цикла, были составлены следующие запросы, для того, чтобы сравнить представленность ферментов, необходимых для этилмалонил-коА пути:

запросы для сравнения протеомов по наличию ферментов этилмалонил-коА пути:

(ec:1.3.1.85 OR ec:5.1.99.1 OR ec:5.4.99.63 OR ec:1.3.8.12 OR ec:5.4.1.3. OR ec:4.2.1.153 OR ec:4.2.1.148 OR ec:4.1.3.24 OR ec:6.2.1.9) AND organism:"Cereibacter sphaeroides (strain ATCC 17023 / DSM 158 / JCM 6121 / CCUG 31486 / LMG 2827 / NBRC 12203 / NCIMB 8253 / ATH 2.4.1.) (Rhodobacter sphaeroides) [272943]" AND proteome:up000002703

(ec:1.3.1.85 OR ec:5.1.99.1 OR ec:5.4.99.63 OR ec:1.3.8.12 OR ec:5.4.1.3. OR ec:4.2.1.153 OR ec:4.2.1.148 OR ec:4.1.3.24 OR ec:6.2.1.9) AND organism:"Rhodobacter capsulatus (strain ATCC BAA-309 / NBRC 16581 / SB1003) [272942]" AND proteome:up000002361

этилмалонил-коА путь (необходимые ферменты) [8] Cereibacter sphaeroides Rhodobacter capsulatus
код фермента название наличие/отсутствие фермента
1.3.1.85 кротонил-КоА карбоксилаза/редуктаза
5.1.99.1 метилмалонил-КоА эпимераза
5.4.99.63 этимлмалонил-КоА мутаза
1.3.8.12 (2S)-метилсукцинил-КоА дегидрогеназа
5.4.1.3 2-метилфумарил-КоА изомераза
4.2.1.153 3-метилфумарил-КоА гидратаза
4.2.1.148 2-метилфумарил-КоА гидратаза
4.1.3.24 малил-КоА лиаза
6.2.1.9 малат-КоА лигаза
таб. 2. представленность классов ферментов, необходимых для этилмалонил-коА пути.

Cereibacter sphaeroides имеет в своем протеоме больше необходимых ферментов, чем Rhodobacter capsulatus, что логично, т.к. этилмалонил-КоА путь синтеза является у Cereibacter sphaeroides единственным, в то время как Rhodobacter capsulatus имеет гены отвечающие и за этилмалонил-КоА путь, и за глиоксилатный цикл [6].

По результатам запроса Cereibacter sphaeroides:

name:"isocitrate lyase" AND proteome:up000002703

не было найдено никаких результатов.

Для Rhodobacter capsulatus:

name:"isocitrate lyase" AND proteome:up000002361

был найден один белок с именем "изоцитрат-лиаза" (id D5AS40). Что тоже подтверждает, что Cereibacter sphaeroides не имеет изоцитат-лиазы, а значит - глиоксилатного цикла[6].

Сравнение протеомов по "СС" полям.

Можно сранить протеомы по полям "СС" с пометкой '-!- PATHWAYS'. Для этого был использован следующий

скрипт, результатом которого является файл формата "метаболитический путь и комментарии к нему - количество совпадений внутри файла с протеомом". В протеомах обоих организмов больше всего белков, принимающих участвие в синтезе клеточной мембраны, синтезе пептидогликана. Примерно на одном уровне находятся значения белков, отвечающих за метаболизм порфириносодержащих соединений (в данном случае - бактериохлорофиллов) и биосинтез кофактора аденозилкобаламина.

С помощью вертикального поиска по таблицам, стало известно, что у 324 белков из протеомов полностью совпадают описания метаболитических путей, в которых они принимают участие (учитывая совпадающие "внутри" одного организма описания - 22 различных описаний белков на 2 протеома). У Cereibacter sphaeroides было найдено 365 описаний, а у Rhodobacter capsulatus - 357 .

Таким образом, можно говорить о схожести метаболический путей у Cereibacter sphaeroides и Rhodobacter capsulatus.