Сначала я нашла протеом своей бактерии Clostridium estertheticum subsp. estertheticum, используя запрос: (taxonomy_id:1552). Идентификатор протеома - UP000182569, он является референсным. CPD - Close to standard (high value). Согласно BUSCO имеет полноту 98.9% (1.1% отсутствует). Далее я скачала этот протеом на кодомо с помощью команды: wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=(proteome:UP000182569)' -O UP000182569.swiss.gz. Количество белков в протеоме - 4,203.
Моя бактерия не является патогенной, поэтому для сравнения я решила взять ее патогенного родственника. Я выбрала Clostridium botulinum, которая вызывает ботулизм. Ее протеом является референсным, идентификатор - UP000001986. CPD - standart. BUSCO 100%. Его я скачала командой wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&download=true&format=txt&query=(proteome:UP000001986)' -O UP000001986.swiss.gz. Количество белков в протеоме - 3,589.
Чтобы посчитать количество трансмембранных белков я использовала команду bash:
zgrep -c 'KW Transmembrane {' UP000182569.swiss.gz | less; zgrep -c 'KW Transmembrane {' UP000001986.swiss.gz | lessУ Clostridium estertheticum subsp. estertheticum 1003, что составляет 23,86%, а у Clostridium botulinum 827 (23,04%).
Чтобы срвнить количество фермнтов, я использовала поиск в UniProt. Запрос для Clostridium estertheticum subsp. estertheticum - (proteome:UP000182569) AND (ec:*). Всего у этой бактерии 753 фермента (17,92%). Для Clostridium botulinum запрос - (proteome:UP000001986) AND (ec:*). У этой бактерии 743 фермента (20,70%).
Clostridium botulinum известна своими выделяемыми токсинами, поэтому я решила поискать токсины в Clostridium estertheticum subsp. estertheticum. Для этого я использовала команду bash - zgrep KW *1986* | grep Toxin | less. Результаты команды для Clostridium botulinum:
KW Secreted; Toxin; Transmembrane; Transmembrane helix; Virulence; Zinc.
KW Toxin-antitoxin system {ECO:0000256|ARBA:ARBA00022649}.
KW Toxin-antitoxin system {ECO:0000256|ARBA:ARBA00022649}.
KW Toxin {ECO:0000313|EMBL:CAL82355.1}.
KW Toxin {ECO:0000313|EMBL:CAL82356.1}.
KW Toxin {ECO:0000313|EMBL:CAL82357.1}.
Первая строчка пренадлежит записи, описывающей Botulinum neurotoxin type A, 3 последние строчки относятся к записям про домены этого же нейротоксина. Toxin-antitoxin system не относится к патогенности бактерии, эта система для контроля наследования плазмиды дочерними клетками. Результаты поиска для Clostridium estertheticum subsp. estertheticum:
KW Toxin-antitoxin system {ECO:0000256|ARBA:ARBA00022649}.
KW Toxin-antitoxin system {ECO:0000256|ARBA:ARBA00022649}.
KW Toxin-antitoxin system {ECO:0000256|ARBA:ARBA00022649}.
Все 3 записи про токсин-антитоксин систему, настоящих токсинов нет. Такой результат я и ожидала, что у патогенной бактерии будут токсины, а у непатогенной - нет.
Я решила сравнить протеомы по средней длине белка, для этого я использовала код на python . Средняя длина белка у Clostridium estertheticum subsp. estertheticum - 310,18 ам. ост., а у Clostridium botulinum - 293,16 ам. ост.