Работа с UniProt Proteomes, EMBOSS, bash

Чингариева Алия

Студентка первого курса факультета биоинженерии и биоинформатики МГУ им. М. В. Ломоносова,

2024 год

Выбор и скачивание протеомов

Для сравнения было выбрано два протеома: первый относится к бактерии Enterococcus mundtii, второй — к Enterococcus gallinarum, которая заинтересовала меня благодаря исследованию ученых из Yale University. Согласно этому исследованию, у некоторых бактерий тонкого кишечника наблюдается способность перемещаться в другие органы и вызывать аутоимунный ответ, приводя к таким заболеваниям, как системная красная волчанка или гепатит. Первоочередно, в исследовании ссылались на E. gallinarum, что не могло не заинтересовать. Помимо этого, я нашла работы, указывающие на то, что вид E. gallinarum может быть использован при лечении и профилактике некоторых видов рака.

Протеом E. mundtii имеет идентификатор UP000189299, а протеом E. gallinarum — UP000055269. Количество белков в протеоме составляет 3017 и 3502 соответственно, значения CPD — standard и close to standard(high value). Сильных расхождений в показаниях BUSCO не наблюдается.

Протеом E. mundtii был скачан командой:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000189299' -O ~/term2/pr8/UP000189299.swiss.gz

Протеом E. gallinarum был скачан командой:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000055269' -O ~/term2/pr8/UP000055269.swiss.gz

Сравнение протеомов по представленности определенных групп белков

1. Трансмембранные белки


E. mundtii: С помощью запроса (proteome:UP000189299) AND (keyword:KW-0812) было найдено 738 белков, то есть ~24,5%. E. gallinarum: С помощью запроса (proteome:UP000055269) AND (keyword:KW-0812) было найдено 886 белков, то есть ~25,3%.



2. Ферменты


Для подсчета числа белков-ферментов была использована функция:
zgrep '^DE' PROTEOM-ID.swiss.gz | grep 'RecName: Full=' | grep -i '[a-z]ase' | wc -l

E. mundtii: 685
E. gallinarum: 801



3. Устойчивость к антибиотикам


Мне захотелось проверить, есть ли у выбранных бактерий факторы устойчивости к воздействию антибиотиков.

Для подсчета была использована функция:
zcat PROTEOM-ID.swiss.gz | grep 'KW' | grep 'Antibiotic resistance' | wc -l

E. mundtii: 4
E. gallinarum: 5

Сравнение протеомов по частоте упоминания ABC-транспортеров

Для подсчета числа белков-ферментов была использована функция:
zcat PROTEOM-ID.swiss.gz | grep 'ABC TRANSPORTER' | wc -l

E. mundtii: 116
E. gallinarum: 208