Эндогликоцерамидазы (EGCases) -- ферменты из класса гидролаз. Они гидролизуют гликозидную связь между олигосахаридом и частью гликосфинголипида. Однако точный механизм регулирования строгой специфичности субстрата этих гликозидаз не известен (Y.Han et al.,2017 ).
Бактерия Rhodococcus hoagii из которой был выделен этот белок является единственным признаным патогеном из актинобактерий, которых часто используют биотехнологи (J.Vazquez-Boland et al.,2019).
Белку соответствует идентификатор A0A3S5YBC7. Состоит он из 492 аминокислот. Также известна его структура: есть три записи PDB с разным разрешением (ID 5CCU, 5J14, 5J7Z). Белок входит в кластеры UniRef50_A0A3S5YBC7 (144 записи), UniRef90_A0A3S5YBC7 (32 записи) и UniRef100_A0A3S5YBC7 (1 запись).
Эндогликоцерамидаза (мой белок) принадлежит бактерии Rhodococcus hoagii, для которой доступен референсный протеом UP000004245. В протеом входят 5029 белков. BUSCO полных белков равен 99,1%, а CPD "Standard", что показывает, что протеом хорошо изучен.
В качестве второго (контрольного) я выбрала протеом UP000024941. Он принадлежит Rhodococcus aetherivorans. Это близкий непатогенный родственник с хорошо изученным протеомом (BUSCO полных белков 99,5%, CPD "Standard")
В таблицах 1 и 2 приведены результат сравнения двух протеомов. Для получения долей различных видов белков я использовала расширенный поиск в Uniprot (запросы приведены ниже только для Rhodococcus hoagii, для Rhodococcus aetherivorans аналогичные).
Доля ферментов, а именно оксидоредуктаз, довольно сильно отличается: у R. hoagii сильно меньше, чем у R.aetherivorans. Возможно это связано с образами жизни бактерий: Rhodococcus hoagii патоген, то есть теоретически может уменьшать количество фрментов и пользоваться готовыми веществами от "жертвы".
белок | Rhodococcus hoagii | Rhodococcus aetherivorans |
---|---|---|
трансмембранный | 922 (18,33%) | 960 (17,43%) |
фермент | 916 (18,21%) | 1252 (22,73%) |
класс фермента | Rhodococcus hoagii | Rhodococcus aetherivorans | ||
---|---|---|---|---|
количество | доля | количество | доля | |
1 | 195 | 3,88% | 329 | 5,97% |
2 | 303 | 6,03% | 372 | 6,75% |
3 | 184 | 3,66% | 204 | 3,70% |
4 | 95 | 1,89% | 151 | 2,74% |
5 | 51 | 1,01% | 70 | 1,27% |
6 | 82 | 1,63% | 124 | 2,25% |
7 | 23 | 0,46% | 26 | 0,47% |
Для трансмембранных белков: annotation:(type:transmem) AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245
Для ферментов: ec:* AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245
Для оксидоредуктаз (1 класс): ec:1* AND organism:"Rhodococcus hoagii ATCC 33707 [525370]" AND proteome:up000004245
Для остальных 6 классов аналогично первому.
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000004245&format=txt&compress=yes' -O UP000004245.swiss.gz
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000024941&format=txt&compress=yes' -O UP000024941.swiss.gz
С помощью конвеера (1) в bash я посмотрела первые аминокислоты белков моих бактерий, результаты представлены в таблице 3.
Как можно заметить, в качестве первой аминокислоты фигурирует не только метеонин, поэтому был создан второй конвеер (2), который будет выводить названия белков с нетипичным началом. Все "белки" с неклассическим началом -- фрагменты.
(1) zcat UP000004245.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
(2) zcat UP000004245.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^M' | grep -v '^>' -B1 | grep '^>' | tr -d '>'
Для второй бактерии аналогично.
A | D | E | G | H | L | M | P | Q | R | V | |
---|---|---|---|---|---|---|---|---|---|---|---|
R. hoagii | 5 | 1 | 1 | 3 | 2 | 2 | 5007 | 4 | 2 | 2 | |
R. aetherivorans | 4 | 5500 | 1 | 3 | 1 |
1) Y.Han et al.,2017 "Structural Insights into the Broad Substrate Specificity of a Novel Endoglycoceramidase I Belonging to a New Subfamily of GH5 Glycosidases" doi: 10.1074/jbc.M116.763821
2) J.Vazquez-Boland et al.,2019 "The pathogenic actinobacterium Rhodococcus equi: what's in a name?" doi: 10.1111/mmi.14267