UniProt

1 ВВЕДЕНИЕ

Цианофициназа (цианофицин протеаза) – фермент, гидролизующий цианофицин.[1] Цианофицин – биополимер, состоящий из остатков аспаргиновой кислоты и аргинина, используемый для хранения фиксированного азота.[2] Источник последовательности белка – пресноводная цианобактерия Synechocystis sp. PCC6803. Как и многие цианобактерии, она способна фиксировать азот.[3]

Рис. 1
Рис. 1. Реакция гидролиза цианофицина.[4]

2 ИНФОРМАЦИЯ О БЕЛКЕ В UNIPROT

Запись о белке основана на нуклеотидной последовательности в базе данных EMBL с идентификатором BA000022. Запись в PDB с идентификатором 3EN0 содержит трёхмерную структуру белка. Она получена рентгеноструктурным анализом c разрешением 1,50 Å. При это известна полная структура трёх цепей. Каждая цепь имеет длину равную 271 аминокислотным остаткам и массу 29 390 Да.

3 КЛАСТЕРЫ В UNIREF

В кластерах UniRef100_P73832, UniRef90_P73832 и UniRef50_P73832 содержится 4, 7 и 594 белка соответственно. Во всех трёх кластерах белок является репрезентативной последовательностью.

4 ЗАПРОСЫ В UNIPROT

Результаты запросов в UniProt показали, что цианофициназа широко распространена за пределами отдела Цианобактерии, однако все белки кластера UniRef50_P73832 принадлежат представителям данного отдела. Что примечательно существование на уровне белка или транскриптома доказано только для двух белков, в то время как всего существует более 6 000 записей.

5 СРАВНЕНИЕ ПРОТЕОМОВ

Исследуемый белок принадлежит протеому UP000001425, для сравнения взял протеом UP000238762, т. к. он принадлежит Merismopedia glauca CCAP 1448/3 – организму из того же семейства. Для скачивания протеомов использованы команды:

wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000001425&format=txt&compress=yes' -O ~/term2/pr8/UP000001425.swiss.gz

wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000238762&format=txt&compress=yes' -O ~/term2/pr8/UP000238762.swiss.gz

Первый протеом содержит 3 507 белков, а второй протеом содержит 4 638 белков. Согласно BUSCO оба протеома высокого качества. При этом второй протеом содержит больше белков, чем протеомы близких организмов. Для определения первой аминокислоты в белках протеома использованы команды:

zcat UP000001425.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c

zcat UP000238762.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^>' | sort | uniq -c

В исследуемом протеоме все белки начинаются с метионина. В контрольном протеоме большая часть белков начинается с метионина, однако есть некоторые исключения. Рассмотрим описание белков, начинающихся не с метионина с помощью команды:

zcat UP000238762.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v '^M' | grep -vB1 '^>' | less -S

Для всех этих белков указан флаг Fragment, который означает, что полная последовательность не определена. В связи с этим нельзя гарантировать, что данные белки действительно начинаются с аминокислоты, отличной от метионина.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Функциональная группа белков Synechocystis sp. (strain PCC 6803 / Kazusa) Merismopedia glauca CCAP 1448/3
Количество белков Доля, % Количество белков Доля, %
Трансмембранные 1 336 38,09 1 717 37,02
Ферменты 743 21,19 664 14,32
Оксидоредуктазы 129 3,68 90 1,94