Практикум 8

1. Выбор и скачивание протеомов

Так как Pseudomonas paraerogina согласно классификации в UniProt штамм в составе P.aeroginosa, было решено искать именно по этому организму. Введя "Pseudomonas aeroginosa" в банке "Proteoms" я выбрал референсный протеом (ID:UP000002438, CPD: Close to standard (low value), BUSCO:99.5%), содержащий 5,563 белков.

В качестве контрольной была выбрана Pseudomonas oryzihabitans — условно-патогенная бактерия, менее резистентная к антибиотикам и менее летальная, чем P.aeroginosa. Произведя поиск аналогичный предыдущему я выбрал рефересный протеом (ID:UP000064137, CPD:Outlier (low value), BUSCO:97.8%), содержащий 4,281 белков.

Команды для скачивания:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000002438' -O UP000002438.swiss.gz
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000064137' -O UP000064137.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

Поиск проводился c помощью UniProtKB.

1.Трансмембранные белки

У P.aeroginosa было найдено 1,143 белка — 20,5% протеома. P.oryzihabitans имеет 857 трансмембранных белков — 20,0% протеома.

Запросы соответсвенно: "(proteome:UP000002438) AND (ft_transmem:*)" и "(proteome:UP000064137) AND (ft_transmem:*)".

2.Ферменты

У P.aeroginosa было найдено 1,266 белка — 22% протеома. P.oryzihabitans имеет 943 фермента — 22% протеома.

Запросы соответсвенно: "(proteome:UP000002438) AND (ec:*)" и "(proteome:UP000064137) AND (ec:*)".

3.Токсины

Одна из причин опасность P.aeroginosa — выделяемые ею токсины. Было решено проверить есть-ли они у менее опасной P.oryzihabitans.

Запросы соответсвенно:"(proteome:UP000002438) AND (keyword:KW-0800)" и "(proteome:UP000064137) AND (keyword:KW-0800)".

У P.aeroginosa было найдено 4 токсина, а у P.oryzihabitans ни одного. Это может объяснить отличия в летальности этих бактерий.

3. Наличие белков с 3D-структурами

Последним я решил узнать о количестве белков в протеомах с известными 3D-структурами. Использовав нижеприведенный код на Bash удалось узнать что в протеоме P.aeroginosa содержится 776 с изветными 3D-структурами, а в протеоме P.oryzihabitans — 0.

Код на Bash:


zgrep 'KW' UP000002438.swiss.gz|grep -c '3D-structure'|less
zgrep 'KW' UP000064137.swiss.gz|grep -c '3D-structure'|less