Идентификатор сборки в RefSeq GCF_014217215.1
Страница сборки из базы NCBI Datasets Genome: Genome assembly ASM1421721v1
Поисковый запрос в UniProt Proteomes: (genome_assembly:GCA_014217215.1) выдал 0 результатов
Поисковый запрос по UniProt Proteomes: (taxonomy_id:85336) выдал 4 результатая выбрала UP000192359 так как он референсный.
Идентификатор протеома: UP000192359
Скачивание протеома: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=(proteome:UP000192359)' > UP000192359.swiss.gz
Поисковый запрос на сайте UniProt: (proteome:UP000192359) AND ((ec:*) OR (cc_catalytic_activity:*) OR (protein_name:enzyme))
Количесиво белков, обладающих какой-либо ферментативной активностью: 514
Конвейер bash: zgrep -E '^DE.*(EC=| enzyme)' UP000192359.swiss.gz | uniq | wc -l
Количесиво белков, обладающих какой-либо ферментативной активностью: 518
Цель: проверить, является ли первая аминокислота каждого белка в протеоме метионином
Конвейер bash: zgrep -A1 '^SQ' UP000192359.swiss.gz | grep -v -e '-' -e 'SQ' | tr -d ' ' | grep -v '^M'| wc -l
Выдает 5 результатов Значит в протеоме есть белки, начинающиеся не с метионина. Наиболее частая причина такого явления - отщепление стартового метионина после синтеза белка. К примеру метионинаминопептидазы удаляют N-концевой метионин, если следующая аминокислота имеет маленький радиус.