Так как Pseudomonas paraerogina согласно классификации в UniProt штамм в составе P.aeroginosa, было решено искать именно по этому организму. Введя "Pseudomonas aeroginosa" в банке "Proteoms" я выбрал референсный протеом (ID:UP000002438, CPD: Close to standard (low value), BUSCO:99.5%), содержащий 5,563 белков.
В качестве контрольной была выбрана Pseudomonas oryzihabitans — условно-патогенная бактерия, менее резистентная к антибиотикам и менее летальная, чем P.aeroginosa. Произведя поиск аналогичный предыдущему я выбрал рефересный протеом (ID:UP000064137, CPD:Outlier (low value), BUSCO:97.8%), содержащий 4,281 белков.
Команды для скачивания:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000002438' -O UP000002438.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000064137' -O UP000064137.swiss.gz
Поиск проводился c помощью UniProtKB.
У P.aeroginosa было найдено 1,143 белка — 20,5% протеома. P.oryzihabitans имеет 857 трансмембранных белков — 20,0% протеома.
Запросы соответсвенно: "(proteome:UP000002438) AND (ft_transmem:*)" и "(proteome:UP000064137) AND (ft_transmem:*)".
У P.aeroginosa было найдено 1,266 белка — 22% протеома. P.oryzihabitans имеет 943 фермента — 22% протеома.
Запросы соответсвенно: "(proteome:UP000002438) AND (ec:*)" и "(proteome:UP000064137) AND (ec:*)".
Одна из причин опасность P.aeroginosa — выделяемые ею токсины. Было решено проверить есть-ли они у менее опасной P.oryzihabitans.
Запросы соответсвенно:"(proteome:UP000002438) AND (keyword:KW-0800)" и "(proteome:UP000064137) AND (keyword:KW-0800)".
У P.aeroginosa было найдено 4 токсина, а у P.oryzihabitans ни одного. Это может объяснить отличия в летальности этих бактерий.
Последним я решил узнать о количестве белков в протеомах с известными 3D-структурами. Использовав нижеприведенный код на Bash удалось узнать что в протеоме P.aeroginosa содержится 776 с изветными 3D-структурами, а в протеоме P.oryzihabitans — 0.
zgrep 'KW' UP000002438.swiss.gz|grep -c '3D-structure'|less
zgrep 'KW' UP000064137.swiss.gz|grep -c '3D-structure'|less