Учебный сайтик
Кирилла Прокаповича

Поиск протеома

В NCBI у Pusillibacter faecalis версия в GenBank GCA_018408705.1, в UniProt Proteomes по этой версии сборки в поиске ID протеома UP000679848.

Поиск и скачивание референсного протеома

Для скачивания протеома я использовал этот скрипт.

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000679848' -O UP000679848.swiss.gz

Оценка количества ферментов в протеоме

При вводе конвейера ниже получается 496 ферментов.

zcat UP000679848.swiss.gz | grep -e '^DE' | grep -c "EC="

Анализ протеома консольными средствами

Для подсчета кол-ва различных первых аминокислот у белков, я использовал конвейер, приведенный ниже. Этот конвейер выдал 3463 M, это половина от всего протеома бактерии, что значит не всегда первый кодон гена ATG, данное изменение могло возникнуть благодаря муатциям и горизонтальному переносу.

zcat UP000679848.swiss.gz | grep -A1 -e "^SQ" | grep -v -e "^SQ" | tr -d ' ' | cut -c 1 | sort | uniq -c