Сравнение протеомов

Для моей бактерии Cupriavidus cauae описан один протеом, который, к сожалению, не явялется референсным, но я все равно выбрала его, так как у него хорошее качество (всего 0.9% потерянных (missing) белков).

Для сравнения я взяла референсный протеом бактерии Burkholderia pseudomallei из того же отряда, но являющейся патогенной.


Таблица 1. Сравнение характеристик
Бактерия Cupriavidus cauae Burkholderia pseudomallei
Proteome ID UP000324324 UP000000605
CPD Close to standard (low value) Close to standard (low value)
Number of entries 4 900 5 717
In Swiss-Prot 0 497
BUSCO
Cupri
Burkh

Команды для скачивания

Cupriavidus cauae: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000324324' -O UP000324324.swiss.gz

Burkholderia pseudomallei (strain K96243): wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=UP000000605' -O UP000000605.swiss.gz


Сравнения по группам белков
Таблица 2. Сравнение по группам белков
Бактерия Cupriavidus cauae Burkholderia pseudomallei
Трансмембранные белки 966 (19.7%) 1139 (19.9%)
Ферменты 38 (0.78%) 26 (0.45%)
Фактор вирулентности 4 (0.08%) 18 (0.31%)

Используеммые команды:

1.1) zgrep '^KW' UP000324324.swiss.gz | grep 'Transmembrane {' | wc -l | less

1.2) zgrep '^KW' UP000000605.swiss.gz | grep 'Transmembrane {' | wc -l | less

2.1) zgrep '^KW' UP000324324.swiss.gz | grep 'enzyme {' | wc -l | less

2.2) zgrep '^KW' UP000000605.swiss.gz | grep 'enzyme {' | wc -l | less

3.1) zgrep '^KW' UP000324324.swiss.gz | grep 'Virulence {' | wc -l | less

3.2) zgrep '^KW' UP000000605.swiss.gz | grep 'Virulence {' | wc -l | less


Анализ:

Так как вторая бактеррия (контроль) являестя патогенной, то логично, что в ее протеоме должно быть больше белков, отвечающих за вирулентность (по результатам поиска так и получилось). Кроме того, интересно то, что у моей бактерии тоже есть (небольшой, но все же) процент таких белков. Возможно она тоже может вызывать какие-то патогенные процессы ? (хоть она и выделена из крови человека с имуннодефицитом, я все же считала, что туда она попала случайно, так как родственные ей бактерии находятся на водоочистительных станциях и чаще всего взаимодейтсвуют как-то с металлами)


Еще немножечко манипуляций...

Я решила пройтись по ключевым словам и самым распространенным белкам (+ еще несколько специфичных, которые связаня с жизнедеятельностью этих бактерий).

Таблица 3. Смешанная сравнительная таблица
Бактерия Cupriavidus cauae Burkholderia pseudomallei
3D-structure 0 59
Статьи в PubMed 0 73
Reference proteome 0 5 717
Metal 445 507

Используеммые команды:

1. (keyword:KW-0002) AND (proteome:UP000324324) и (keyword:KW-0002) AND (proteome:UP000000605)

2. zgrep '^RX' UP000324324.swiss.gz | grep 'PubMed' | sort -u | wc -l | less и zgrep '^RX' UP000000605.swiss.gz | grep 'PubMed' | sort -u | wc -l | less

3. (keyword:KW-1185) AND (proteome:UP000324324) и (keyword:KW-1185) AND (proteome:UP000000605), а так же (keyword:KW-1185) AND (proteome:UP000053474)

4. (keyword:KW-0479) AND (proteome:UP000324324) и (proteome:UP000000605) AND (keyword:KW-0479)

Анализ:

Исходя из данных, представленных в первой и второй строчках таблицы, можно сделать вывод, что моя бактерия является очень плохо изученной и плохо аннотированной, так как данных о 3D структуре и статьей по ней - 0, в то время как для референсного геном бактерии-контроля - это число превишает 50 по двум параметрам, что логично.

Поиск по ключевым словам "Reference proteome" был проведен просто чтобы убедиться, что все белки второй бактерии являются референсными, в то время как у первой (у моей) их совсем нет (то есть она не является референсной). Для личного инетреса я еще посмотрела протеом бактерии Cupriavidus sp. HPC(L), частью которого явялется протеом моей бактерии. Она как раз таки является рефенесной (что и подтверждает мой запрос: всего белков - 4779, референсных - столько же).

Так как Cupriavidus cauae и ее родственники тесно связаны с металлами в своей жизни (предполагаемо), я решила еще проверить наличие ключевых слов "Metal-binding" (это не в рамках исследования аннотированности). Оказалось, что моя бакьерия имеет меньше белков, связывающих металлы, чем другая бактерия из того же отряда, что может навести на мысль либо более сильной связи второй бактерии с таким типом жизнедеятельности, либо то, что моя бактерия может жить за счет других штук в большей степени.