Обзор протеома бактерии Bartonella krasnovii

Поиск референсного протеома

Протеом штамма OE 1-1, который мы анализировали до этого имеет:
Идентификатор геномной сборки в RefSeq: GCF_003606345.3 (версия 3 является последней на данный момент)
Идентификатор INSDC (GenBank/ENA/DDBJ): GCA_003606345.3

ссылка на протеом Bartonella krasnovii

Поищем референсный протеом среди других штаммов того же вида Bartonella krasnovii, очевидно, они будут наиболее схожими. По запросу (taxonomy_id:2267275) AND (busco:[95 TO *]) в базе Proteoms в UniProt нам выдало 2 протеома: наш штамм OE 1-1 (1 655 белков) и B35_1_2 (1 567 белков). Но он плохо аннотирован. Поищем что-нибудь поинтереснее.
В описании Bartonella krasnovii написано, что её протеом является частью панпротеома Bartonella bovis 91-4 , который включает 1267 последовательностей белков. На страницу протеома Bartonella bovis 91-4 можно перейти либо со страницы Bartonella krasnovii, либо поискать через поиск Proteoms:
(taxonomy_id:773) AND (busco:[95 TO *]) AND (proteome_type:1) AND (cpd:3).
Скачаем его с помощью команды:

 wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28%28proteome%3AUP000014038%29%29' -O UP000014038.swiss.gz
ссылка на протеом Bartonella bovis 91-4
ID протеома UP000014038
Название вида и штамма Bartonella bovis 91-4 | 91-4
ID таксона 1094491
Количество белков 1267
CPD Close to standard (low value)
BUSCO n:639 · rhizobiales_odb10 C:95.3% (S:95.1% D:0.2%) F:0.2% M:4.5%

Ищем и считаем ферменты

Вбив в поиск UniProtKB ID нашей референсной бактерии получим 1.267 результатов белков - (taxonomy_id:1094491).

Оценим количество ферментов

Усреднив значения, можем сказать, что примерно треть протеома это ферменты

3D-структура и аннотации

Немного удивительно, но ни ни один белок не аннотирован и не указана 3D структура. По запросам UniProtKB (taxonomy_id:1094491) AND (structure_3d:true) и (taxonomy_id:1094491) AND (reviewed:true) 0 результатов.
Поиск в bash дал аналогичный ответ:

zgrep 'KW' UP000014038.swiss.gz|grep -i '3D-structure'| wc -l

Тогда посмотрим на основании чего установлена структура:

zgrep '^PE' UP000014038.swiss.gz | grep -c 'Inferred from homology'
zgrep '^PE' UP000014038.swiss.gz | grep -c 'Predicted'
zgrep '^PE' UP000014038.swiss.gz | grep -v -e 'Predicted' -e 'Inferred from homology' | wc -l 
777 структуры установлены на основе гомологии, 488 предсказаны, о двух получены доказательства на уровне транскрипта. Это фермент Lon protease и шаперон Chaperone protein DnaK.

Ищем белок системы секреции

В практикуме 7 мы анализировали белок системы секреции 4, она является приспособлением штаммов к условиям среды и повышению вирулентности:

zgrep '^DE' UP000014038.swiss.gz | grep 'secretion system'| less
Нашёлся белок под названием "Type III secretion system HrpE domain-containing protein". Не совсем тот, но входит в комплекс, выполняющий схожие функции. Белки этих систем ответственны за бактериальную конъюгацию и экзоцитоз холероподобных токсинов. Филогении указывают на недавний перенос семи генов в кластере генов virB для системы секреции типа IV от адаптированного к кошкам B. henselae к адаптированному к собакам штамму B. vinsonii [1]. Так что возможно, наш штамм Bartonella krasnovii получил этот белок тоже в результате горизонтального переноса.

Анализ на токсины

Есть системы секреции, которые обеспечивают экзоцитов токсинов, то должны быть сами токсины:

 zgrep '^DE' UP000014038.swiss.gz | grep -i 'toxin' | less
Мы нашли 7 токсинов:
Addiction module toxin, RelE/StbE family
CtxA-like, cholera toxin A subunit
BrnT family toxin
BrnT family toxin
BrnT family toxin
CtxA-like, cholera toxin A subunit
Toxin HicA

Видим, что гены продублированы. Можно сделать несколько предположений, для чего это нужно:
1. Это необходимо для повышения эффективности интоксикации
2. Белок с одним и тем же названием, но из разных генов проходит различные посттрансляционные модификации
3. Это результат мутации
4. Вероятно, две копии токсина BrnT family находятся недалеко друг от друга и хранятся в одном опероне, как резервные копии