В мини-обзоре для бактерии Xylophilus rhododendri использовалась геномная сборка NCBI RefSeq GCF_009906855.1
Ссылка на страницу сборки в базе NCBI Datasets Genome
- Идентификаторы геномной сборки для бактерии Xylophilus rhododendri
в RefSeq: GCF_009906855.1
в INSDC: GCA_009906855.1
- Поисковый запрос по UniProt Proteomes, который выдал протеом: (genome_assembly:GCA_009906855.1)
- Идентификатор протеома: UP000464787
- Статус протеома: референсный
Для бактерии Xylophilus rhododendri протеом UP000464787 является референсным, поэтому он был взят для выполнения дальнейших заданий.
Поисковый запрос для этого протеома в UniProt Proteomes: (taxonomy_id:2697032) AND (proteome_type:1).
Для скачивания белковой записи, принадлежащей выбранному протеому была использована команда:
curl 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000464787)' > UP000464787.swiss.gz
1. Записи с ключом HELIX:
Конвейер в bash: zgrep -e '^FT *HELIX' -e '^ID' UP000464787.swiss.gz | grep -B1 'HELIX' | grep '^ID' | wc -l
Результат: 0 записей
2. Записи с ключом TRANSMEM:
Конвейер в bash: zgrep -e '^FT *TRANSMEM' -e '^ID' UP000464787.swiss.gz | grep -B1 'TRANSMEM' | grep '^ID' | wc -l
Результат: 883 записи
Результаты расходятся с представлением о том, что альфа-спирали формируют большинство трансмембранных участков.
Отсутствие записей с альфа-спиралями может указывать на недостаточную изученность протеома бактерии.
1. По запросу: (proteome:UP000464787) AND (ec:*)
для протеома UP000464787 было получено 938 белков, которые потенциально могут обладать каталитической активностью.
Доля таких белков составляет примерно 20% всего протеома.
2. По запросу: (proteome:UP000464787) AND ((keyword:KW-0378) OR (keyword:KW-0560) OR (keyword:KW-0808) OR (keyword:KW-0456) OR (keyword:KW-0413) OR (keyword:KW-0436) OR (keyword:KW-1278))
для протеома UP000464787 было получено 1699 белков, которые могут являться ферментами.
Такие белки составляют примерно 32,5% всего протеома.
В результате анализа двумя поисковыми запросами были получены различающиеся оценки количества ферментов. Оценка по EC-номерам является менее точной, поскольку не у всех ферментов может быть EC-номер в записи UniProtKB. Оценка по ключевому слову (класс фермента) точнее из-за того, исключает белки с неферментативной функцией.