pano

Практикум 7- 8.

Эндогликоцерамидазы (EGCases) -- ферменты из класса гидролаз. Они гидролизуют гликозидную связь между олигосахаридом и частью гликосфинголипида. Однако точный механизм регулирования строгой специфичности субстрата этих гликозидаз не известен (Y.Han et al.,2017 ).

Бактерия Rhodococcus hoagii из которой был выделен этот белок является единственным признаным патогеном из актинобактерий, которых часто используют биотехнологи (J.Vazquez-Boland et al.,2019).

Сведения из записей Uniprot

Белку соответствует идентификатор A0A3S5YBC7. Состоит он из 492 аминокислот. Также известна его структура: есть три записи PDB с разным разрешением (ID 5CCU, 5J14, 5J7Z). Белок входит в кластеры UniRef50_A0A3S5YBC7 (144 записи), UniRef90_A0A3S5YBC7 (32 записи) и UniRef100_A0A3S5YBC7 (1 запись).

Сравнение протеомов

Эндогликоцерамидаза (мой белок) принадлежит бактерии Rhodococcus hoagii, для которой доступен референсный протеом UP000004245. В протеом входят 5029 белков. BUSCO полных белков равен 99,1%, а CPD "Standard", что показывает, что протеом хорошо изучен.

В качестве второго (контрольного) я выбрала протеом UP000024941. Он принадлежит Rhodococcus aetherivorans. Это близкий непатогенный родственник с хорошо изученным протеомом (BUSCO полных белков 99,5%, CPD "Standard")

В таблицах 1 и 2 приведены результат сравнения двух протеомов. Для получения долей различных видов белков я использовала расширенный поиск в Uniprot (запросы приведены ниже только для Rhodococcus hoagii, для Rhodococcus aetherivorans аналогичные).

Доля ферментов, а именно оксидоредуктаз, довольно сильно отличается: у R. hoagii сильно меньше, чем у R.aetherivorans. Возможно это связано с образами жизни бактерий: Rhodococcus hoagii патоген, то есть теоретически может уменьшать количество фрментов и пользоваться готовыми веществами от "жертвы".

Таблица 1. Сравнение долей различных "функциональных групп" двух протеомов
белок Rhodococcus hoagii Rhodococcus aetherivorans
трансмембранный 922 (18,33%) 960 (17,43%)
фермент 916 (18,21%) 1252 (22,73%)

Таблица 2. Сравнение количества разных классов ферменов в протеоме. В таблице 1 -- оксидоредуктазы, 2 -- трансферазы, 3 -- гидролазы, 4 -- лиазы, 5 -- изомеразы, 6 -- лигазы, 7 -- транслоказы.
класс фермента Rhodococcus hoagii Rhodococcus aetherivorans
количество доля количество доля
1 195 3,88% 329 5,97%
2 303 6,03% 372 6,75%
3 184 3,66% 204 3,70%
4 95 1,89% 151 2,74%
5 51 1,01% 70 1,27%
6 82 1,63% 124 2,25%
7 23 0,46% 26 0,47%

Запросы к Uniprot на примере Rhodococcus hoagii

Для трансмембранных белков: annotation:(type:transmem) AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245

Для ферментов: ec:* AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245

Для оксидоредуктаз (1 класс): ec:1* AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245

Для остальных 6 классов аналогично первому.

Первая аминокислота в белках

Команды для скачивания протеомов

wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000004245&format=txt&compress=yes' -O UP000004245.swiss.gz

wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000024941&format=txt&compress=yes' -O UP000024941.swiss.gz

С помощью конвеера (1) в bash я посмотрела первые аминокислоты белков моих бактерий, результаты представлены в таблице 3.

Как можно заметить, в качестве первой аминокислоты фигурирует не только метеонин, поэтому был создан второй конвеер (2), который будет выводить названия белков с нетипичным началом. Все "белки" с неклассическим началом -- фрагменты.

(1) zcat UP000004245.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c

(2) zcat UP000004245.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^M' | grep -v '^>' -B1 | grep '^>' | tr -d '>'

Для второй бактерии аналогично.

Таблица 3. Первая аминокислота белка.
A D E G H L M P Q R V
R. hoagii 5 1 1 3 2 2 5007 4 2 2
R. aetherivorans 4 5500 1 3 1

Список литературы:

1) Y.Han et al.,2017 "Structural Insights into the Broad Substrate Specificity of a Novel Endoglycoceramidase I Belonging to a New Subfamily of GH5 Glycosidases" doi: 10.1074/jbc.M116.763821

2) J.Vazquez-Boland et al.,2019 "The pathogenic actinobacterium Rhodococcus equi: what's in a name?" doi: 10.1111/mmi.14267