Идентификатор сборки RefSeq: GCF_000017265.1
Страница базы данных NCBI Datasets Genome
Идентификатор сборки INSDC: GCA_000017265.1
Поисковый запрос по UniProt Proteomes: (genome_assembly:GCA_000017265.1)
Идентификатор протеома: UP000001868
Статус протеома: Референсный протеом
Найденный протеом является референсным протеомом моей бактерии
Команда для скачивания протеома: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001868' -O UP000001868.swiss.gz
Запрос в UniprotKB: proteome:UP000001868 AND (cc_catalytic_activity:* OR ec:*)
Найдено: 738 результатов
Конвейер bash: zcat UP000001868.swiss.gz | grep -o 'EC=[0-9.-]\+' | sort -u | wc -l
Найдено: 539 результатов
Такое различие в результатах может быть объяснено тем, что в конвейере bash отбираются только уникальные функции ферментов, тогда как запрос в UniprotKB ищет белки с полем описания каталитической активности или EC-номером.
Бактерия Phenylobacterium zucineum является непатогенным эндосимбионтом клеток человека. Поэтому я подумала, что у него должны быть особенности, связанные с транспортными белками, так как эндосимбионт должен обмениваться веществами с хозяином.
Скрипт в bash, который ищет количество транспортных белков бактерии: zcat UP000001868.swiss.gz | awk '/^ID/{id=$2} /^KW/ $$ /Transport/{print id}' | sort -u | wc -l
Результат: 262 трансмембранных белка.
Это меньше, чем у свободноживущих бактерий, как, например, E. coli имеет около трёхсот. Однако это может быть связано с тем, что у P. zucineum геном частично редуцирован.