Практикум 8

1. Поиск протеома, соответствующего геномной сборке

Идентификатор сборки RefSeq: GCF_000017265.1

Страница базы данных NCBI Datasets Genome

Идентификатор сборки INSDC: GCA_000017265.1

Поисковый запрос по UniProt Proteomes: (genome_assembly:GCA_000017265.1)

Идентификатор протеома: UP000001868

Статус протеома: Референсный протеом

2. Поиск и скачивание референсного протеома

Найденный протеом является референсным протеомом моей бактерии

Команда для скачивания протеома: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001868' -O UP000001868.swiss.gz

3. Оценка количества ферментов в протеоме

Запрос в UniprotKB: proteome:UP000001868 AND (cc_catalytic_activity:* OR ec:*)

Найдено: 738 результатов

Конвейер bash: zcat UP000001868.swiss.gz | grep -o 'EC=[0-9.-]\+' | sort -u | wc -l

Найдено: 539 результатов

Такое различие в результатах может быть объяснено тем, что в конвейере bash отбираются только уникальные функции ферментов, тогда как запрос в UniprotKB ищет белки с полем описания каталитической активности или EC-номером.

4. Анализ протеома консольными средствами

Бактерия Phenylobacterium zucineum является непатогенным эндосимбионтом клеток человека. Поэтому я подумала, что у него должны быть особенности, связанные с транспортными белками, так как эндосимбионт должен обмениваться веществами с хозяином.

Скрипт в bash, который ищет количество транспортных белков бактерии: zcat UP000001868.swiss.gz | awk '/^ID/{id=$2} /^KW/ $$ /Transport/{print id}' | sort -u | wc -l

Результат: 262 трансмембранных белка.

Это меньше, чем у свободноживущих бактерий, как, например, E. coli имеет около трёхсот. Однако это может быть связано с тем, что у P. zucineum геном частично редуцирован.