Выбор и скачивание протеомов

Я выбрала протеом UP000016521 бактерии Pseudoalteromonas piscicida из предыдущих практикумов. В качестве контроля был выбран протеом UP000002438 патогенной бактерия Pseudomonas aeruginosa

Вид бактерии Pseudomonas aeruginosa Pseudoalteromonas piscicida
Количество последовательностей(swiss-prot) 5,563(1460) 4,886(0)
CPD Close to standard (low value) Close to standard (high value)
BUSCO C:99.5% (S:99% D:0.5%) F:0.3% M:0.3% C:99.3% (S:98.4% D:0.9%) F:0.5% M:0.2%

Команды для скачивания:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=((proteome:UP000228621))' -O UP001240614.swiss.gz

Вид бактерии Pseudomonas aeruginosa Pseudoalteromonas piscicida
Количество трансмембранных белков(swiss-prot) 1,243(228) 1,007(0)
Количество ферментов 1,273 2,360
Гидролазы 266 193
Modified residue 204 160

Использвались запросы: (proteome:UP000002438) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) для ферментов.

(proteome:UP000016521) AND (keyword:KW-0812) для трансмембранных белков

(proteome:UP000016521) AND (ec:3) для гидролаз

Так как одна из бакетрий патогенная я решила сравнить количество гидролаз. Потому что некоторые патогенные бактерии используют гидролазы для разрушения барьера организма хозяина, защиты от иммунных компонентов

я решила сравнить белки с посттрансляционными модификациями. У Pseudomonas aeruginosa их больше. Возможно это связано с регулированием более сложных процессов или адаптации к стрессовым ситуациям(изменение температуры, давления, наличие токсинов и т.д). Также эти белки могут участвовать в метаболической активности

Искала я Modified residue с помощью поиска по протеомам ((proteome:UP000016521)) и в разделе Proteins with я выбрала Modified residue

Для поиска посттрансляционных остатков был испольована команда zgrep 'FT' UP001240614.swiss.gz| zgrep 'MOD_RES'|wc -l