Для выбранной мной бактерии Vescimonas coprocola описан один протеом, он является референсным.
Среди бактерий рода Vescimonas на сайте UniProt приведены протеомы двух видов: Vescimonas coprocola и Vescimonas fastidiosa. Однако я не нашла существенных отличий между этими видами, поэтому продолжила искать протеомы бактерий одного семейства с моей – семейства Oscillospiraceae. Среди референсных протеомов этой группы первым в поиске был протеом Ruminiclostridium cellulolyticum. Одно из ее существенных отличий от Vescimonas coprocola – положительная окраска по Граму (у Vescimonas coprocola отрицательная).
Организм | Vescimonas coprocola | Ruminiclostridium cellulolyticum |
Идентификатор протеома | UP000681035 | UP000001349 |
Общее количество белков (количество записей) | 2426 | 3287 |
Степень изученности (количество белков протеома в базе Swiss-Prot) | 0 | 209 |
BUSCO | Single:94.3% Duplicated:0.4% Fragmented:1.1% Missing:4.2% | Single:98.5% Duplicated:0.8% Fragmented:0% Missing:0.8% |
CPD | Standard | Close to standard (high value) |
Команды для скачивания белковых записей:
Vescimonas coprocola
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000681035' -O UP000681035.swiss.gz
Ruminiclostridium cellulolyticum
wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=proteome:UP000001349' -O UP000001349.swiss.gz
Организм | Vescimonas coprocola | Ruminiclostridium cellulolyticum | ||||
Запрос | Количество | Доля, % | Запрос | Количество | Доля, % | |
Трансмембранные белки | (proteome:UP000681035) AND (keyword:KW-0812) | 519 | 21.4 | (proteome:UP000001349) AND (keyword:KW-0812) | 718 | 21.8 |
Ферменты | (proteome:UP000681035) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) | 388 | 16.0 | (proteome:UP000001349) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) | 625 | 19.0 |
Гидролазы | (proteome:UP000681035) AND (ec:3) | 95 | 3.9 | (proteome:UP000001349) AND (ec:3) | 182 | 5.5 |
Табл. 2. Количества белков различных «функциональных групп» в протеоме моей бактерии и в контрольном протеоме [1,2]
Большее количество трансмембранных белков в протеоме бактерии Ruminiclostridium cellulolyticum по сравнению с Vescimonas coprocola может быть связано с тем, что она формирует колонии (в отличие от Vescimonas coprocola), поэтому бактериям этого вида необходим более активный контакт друг с другом.
Более высокое количество ферментов у Ruminiclostridium cellulolyticum можно объяснить тем, что этот вид подвижен, в отличие от Vescimonas coprocola, и, следовательно, имеет более высокий уровень метаболизма.
У Ruminiclostridium cellulolyticum гидролаз почти в 2 раза больше, чем у Vescimonas coprocola. Возможно, причиной является тот факт, что Ruminiclostridium cellulolyticum – самая целлюлолитическая бактерия, т. е. использует гидролазы для катализа реакций гидролиза целлюлозы.
Я решила выяснить, сколько раз в каждом из протеомов [1,2] встречаются разные ключевые слова, и сравнить списки 10 самых частых ключевых слов между протеомами. Для этого я использовала программу на языке Python 3.9.
Vescimonas coprocola | Ruminiclostridium cellulolyticum | ||
Reference proteome | 2426 | Reference proteome | 3078 |
Membrane | 538 | Membrane | 732 |
Transmembrane | 519 | Transmembrane helix | 711 |
Transmembrane helix | 518 | Transmembrane | 711 |
Nucleotide-binding | 245 | Transferase | 348 |
ATP-binding | 214 | Metal-binding | 278 |
Transferase | 212 | Hydrolase | 277 |
Metal-binding | 205 | Nucleotide-binding | 263 |
Cytoplasm | 202 | ATP-binding | 230 |
Hydrolase | 167 | Signal | 211 |
Табл. 3. 10 самых частых ключевых слов в протеомах
Самое часто встречающееся ключевое слово - reference proteome, так как протеомы референсные. Также у обеих бактерий часто встречаются слова membrane, transmembrane, transmembrane helix и transferase, что связано с хорошо развитой у них системой мембранных белков (однако у Ruminiclostridium cellulolyticum каждое из перечисленных ключевых слов встречается чаще, чем у Vescimonas coprocola, что подтверждает теорию, описанную в п.2). Еще встречаются ключевые слова nucleotide-binding, ATP-binding и metal-binding, что может указывать на схожий метаболизм у Vescimonas coprocola и Ruminiclostridium cellulolyticum.