В NCBI у Pusillibacter faecalis версия в GenBank GCA_018408705.1, в UniProt Proteomes по этой версии сборки в поиске ID протеома UP000679848.
Для скачивания протеома я использовал этот скрипт.
При вводе конвейера ниже получается 496 ферментов.
Для подсчета кол-ва различных первых аминокислот у белков, я использовал конвейер, приведенный ниже. Этот конвейер выдал 3463 M, это половина от всего протеома бактерии, что значит не всегда первый кодон гена ATG, данное изменение могло возникнуть благодаря муатциям и горизонтальному переносу.