Обзор протеома бактерии Bartonella krasnovii
Поиск референсного протеома
Протеом штамма OE 1-1, который мы анализировали до этого имеет: Идентификатор геномной сборки в RefSeq: GCF_003606345.3 (версия 3 является последней на данный момент) Идентификатор INSDC (GenBank/ENA/DDBJ): GCA_003606345.3
ссылка на протеом Bartonella krasnovii
Поищем референсный протеом среди других штаммов того же вида Bartonella krasnovii, очевидно, они будут наиболее схожими. По запросу (taxonomy_id:2267275) AND (busco:[95 TO *]) в базе Proteoms в UniProt нам выдало 2 протеома: наш штамм OE 1-1 (1 655 белков) и B35_1_2 (1 567 белков). Но он плохо аннотирован. Поищем что-нибудь поинтереснее. В описании Bartonella krasnovii написано, что её протеом является частью панпротеома Bartonella bovis 91-4 , который включает 1267 последовательностей белков. На страницу протеома Bartonella bovis 91-4 можно перейти либо со страницы Bartonella krasnovii, либо поискать через поиск Proteoms: (taxonomy_id:773) AND (busco:[95 TO *]) AND (proteome_type:1) AND (cpd:3). Скачаем его с помощью команды:
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28%28proteome%3AUP000014038%29%29' -O UP000014038.swiss.gzссылка на протеом Bartonella bovis 91-4
ID протеома | UP000014038 |
---|---|
Название вида и штамма | Bartonella bovis 91-4 | 91-4 |
ID таксона | 1094491 |
Количество белков | 1267 |
CPD | Close to standard (low value) |
BUSCO | n:639 · rhizobiales_odb10 C:95.3% (S:95.1% D:0.2%) F:0.2% M:4.5% |
Ищем и считаем ферменты
Вбив в поиск UniProtKB ID нашей референсной бактерии получим 1.267 результатов белков - (taxonomy_id:1094491).
Оценим количество ферментов
- Можем грубо оценить количество ферментов с помощью такого конвейера:
zcat UP000014038.swiss.gz| grep '^DE'|grep -i 'ase'|wc -lПолучилось 1172. Выглядит неразумно.
zgrep '^CC' UP000014038.swiss.gz | grep -c 'CATALYTIC ACTIVITY'Получилось 432, ~34% протеома. Это не очень правдиво, т.к. в описании одного и того же фермента может быть несколько раз упомянута каталитическая активность.
zcat UP000014038.swiss.gz| grep '^DE'| grep -c 'EC='403 результата ~32% протеома. Уже лучше, но явно не точно, т.к. у одного и того же фермента может быть несколько раз указан EC, например:
DE RecName: Full=Carbamoyl phosphate synthase large chain {ECO:0000256|HAMAP-Rule:MF_01210};
DE EC=6.3.4.16 {ECO:0000256|HAMAP-Rule:MF_01210};
DE EC=6.3.5.5 {ECO:0000256|HAMAP-Rule:MF_01210};
Получили 393 белка из 7 классов ферментов, ~31% протеома.
Cc_catalytic_activity (каталитическая активность в разделе "Comments") заполняется вручную кураторами UniProt на основе экспериментальных данных. Только белки с подтвержденной каталитической активностью, обычно из Swiss-Prot, reviewed. А Enzyme Commission numbers включает все предсказанные ферменты, даже без экспериментального подтверждения (из TrEMBL, unreviewed). И в целом, EC-номера присваиваются даже при минимальных данных, как минимум, по гомологии.
Усреднив значения, можем сказать, что примерно треть протеома это ферменты
3D-структура и аннотации
Немного удивительно, но ни ни один белок не аннотирован и не указана 3D структура. По запросам UniProtKB (taxonomy_id:1094491) AND (structure_3d:true) и (taxonomy_id:1094491) AND (reviewed:true) 0 результатов. Поиск в bash дал аналогичный ответ:
zgrep 'KW' UP000014038.swiss.gz|grep -i '3D-structure'| wc -l
Тогда посмотрим на основании чего установлена структура:
zgrep '^PE' UP000014038.swiss.gz | grep -c 'Inferred from homology'
zgrep '^PE' UP000014038.swiss.gz | grep -c 'Predicted'
zgrep '^PE' UP000014038.swiss.gz | grep -v -e 'Predicted' -e 'Inferred from homology' | wc -l777 структуры установлены на основе гомологии, 488 предсказаны, о двух получены доказательства на уровне транскрипта. Это фермент Lon protease и шаперон Chaperone protein DnaK.
Ищем белок системы секреции
В практикуме 7 мы анализировали белок системы секреции 4, она является приспособлением штаммов к условиям среды и повышению вирулентности:
zgrep '^DE' UP000014038.swiss.gz | grep 'secretion system'| lessНашёлся белок под названием "Type III secretion system HrpE domain-containing protein". Не совсем тот, но входит в комплекс, выполняющий схожие функции. Белки этих систем ответственны за бактериальную конъюгацию и экзоцитоз холероподобных токсинов. Филогении указывают на недавний перенос семи генов в кластере генов virB для системы секреции типа IV от адаптированного к кошкам B. henselae к адаптированному к собакам штамму B. vinsonii [1]. Так что возможно, наш штамм Bartonella krasnovii получил этот белок тоже в результате горизонтального переноса.
Анализ на токсины
Есть системы секреции, которые обеспечивают экзоцитов токсинов, то должны быть сами токсины:
zgrep '^DE' UP000014038.swiss.gz | grep -i 'toxin' | lessМы нашли 7 токсинов:
Видим, что гены продублированы. Можно сделать несколько предположений, для чего это нужно: 1. Это необходимо для повышения эффективности интоксикации 2. Белок с одним и тем же названием, но из разных генов проходит различные посттрансляционные модификации 3. Это результат мутации 4. Вероятно, две копии токсина BrnT family находятся недалеко друг от друга и хранятся в одном опероне, как резервные копии