Цианофициназа (цианофицин протеаза) – фермент, гидролизующий цианофицин.[1] Цианофицин – биополимер, состоящий из остатков аспаргиновой кислоты и аргинина, используемый для хранения фиксированного азота.[2] Источник последовательности белка – пресноводная цианобактерия Synechocystis sp. PCC6803. Как и многие цианобактерии, она способна фиксировать азот.[3]
Запись о белке основана на нуклеотидной последовательности в базе данных EMBL с идентификатором BA000022. Запись в PDB с идентификатором 3EN0 содержит трёхмерную структуру белка. Она получена рентгеноструктурным анализом c разрешением 1,50 Å. При это известна полная структура трёх цепей. Каждая цепь имеет длину равную 271 аминокислотным остаткам и массу 29 390 Да.
В кластерах UniRef100_P73832, UniRef90_P73832 и UniRef50_P73832 содержится 4, 7 и 594 белка соответственно. Во всех трёх кластерах белок является репрезентативной последовательностью.
Результаты запросов в UniProt показали, что цианофициназа широко распространена за пределами отдела Цианобактерии, однако все белки кластера UniRef50_P73832 принадлежат представителям данного отдела. Что примечательно существование на уровне белка или транскриптома доказано только для двух белков, в то время как всего существует более 6 000 записей.
Исследуемый белок принадлежит протеому UP000001425, для сравнения взял протеом UP000238762, т. к. он принадлежит Merismopedia glauca CCAP 1448/3 – организму из того же семейства. Для скачивания протеомов использованы команды:
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000001425&format=txt&compress=yes' -O ~/term2/pr8/UP000001425.swiss.gz
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000238762&format=txt&compress=yes' -O ~/term2/pr8/UP000238762.swiss.gz
Первый протеом содержит 3 507 белков, а второй протеом содержит 4 638 белков. Согласно BUSCO оба протеома высокого качества. При этом второй протеом содержит больше белков, чем протеомы близких организмов. Для определения первой аминокислоты в белках протеома использованы команды:
zcat UP000001425.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
zcat UP000238762.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c
В исследуемом протеоме все белки начинаются с метионина. В контрольном протеоме большая часть белков начинается с метионина, однако есть некоторые исключения. Рассмотрим описание белков, начинающихся не с метионина с помощью команды:
zcat UP000238762.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^M' | grep -vB1 '^>' | less -S
Для всех этих белков указан флаг Fragment, который означает, что полная последовательность не определена. В связи с этим нельзя гарантировать, что данные белки действительно начинаются с аминокислоты, отличной от метионина.
Функциональная группа белков | Synechocystis sp. (strain PCC 6803 / Kazusa) | Merismopedia glauca CCAP 1448/3 | ||
---|---|---|---|---|
Количество белков | Доля, % | Количество белков | Доля, % | |
Трансмембранные | 1 336 | 38,09 | 1 717 | 37,02 |
Ферменты | 743 | 21,19 | 664 | 14,32 |
Оксидоредуктазы | 129 | 3,68 | 90 | 1,94 |