UniProt Proteomes, EMBOSS, bash

1 Выбор и скачивание протеомов

Для выбранной мной бактерии Vescimonas coprocola описан один протеом, он является референсным.

Среди бактерий рода Vescimonas на сайте UniProt приведены протеомы двух видов: Vescimonas coprocola и Vescimonas fastidiosa. Однако я не нашла существенных отличий между этими видами, поэтому продолжила искать протеомы бактерий одного семейства с моей – семейства Oscillospiraceae. Среди референсных протеомов этой группы первым в поиске был протеом Ruminiclostridium cellulolyticum. Одно из ее существенных отличий от Vescimonas coprocola – положительная окраска по Граму (у Vescimonas coprocola отрицательная).

Организм Vescimonas coprocola Ruminiclostridium cellulolyticum
Идентификатор протеома UP000681035 UP000001349
Общее количество белков (количество записей) 2426 3287
Степень изученности (количество белков протеома в базе Swiss-Prot) 0 209
BUSCO Single:94.3% Duplicated:0.4% Fragmented:1.1% Missing:4.2% Single:98.5% Duplicated:0.8% Fragmented:0% Missing:0.8%
CPD Standard Close to standard (high value)

Табл. 1. Информация о выбранных протеомах [1,2]

Команды для скачивания белковых записей:

2 Сравнение протеомов по представленности определенных групп белков

Организм Vescimonas coprocola Ruminiclostridium cellulolyticum
Запрос Количество Доля, % Запрос Количество Доля, %
Трансмембранные белки (proteome:UP000681035) AND (keyword:KW-0812) 519 21.4 (proteome:UP000001349) AND (keyword:KW-0812) 718 21.8
Ферменты (proteome:UP000681035) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) 388 16.0 (proteome:UP000001349) AND ((ec:1) OR (ec:2) OR (ec:3) OR (ec:4) OR (ec:5) OR (ec:6) OR (ec:7)) 625 19.0
Гидролазы (proteome:UP000681035) AND (ec:3) 95 3.9 (proteome:UP000001349) AND (ec:3) 182 5.5

Табл. 2. Количества белков различных «функциональных групп» в протеоме моей бактерии и в контрольном протеоме [1,2]

Анализ представленности групп белков

Большее количество трансмембранных белков в протеоме бактерии Ruminiclostridium cellulolyticum по сравнению с Vescimonas coprocola может быть связано с тем, что она формирует колонии (в отличие от Vescimonas coprocola), поэтому бактериям этого вида необходим более активный контакт друг с другом.

Более высокое количество ферментов у Ruminiclostridium cellulolyticum можно объяснить тем, что этот вид подвижен, в отличие от Vescimonas coprocola, и, следовательно, имеет более высокий уровень метаболизма.

У Ruminiclostridium cellulolyticum гидролаз почти в 2 раза больше, чем у Vescimonas coprocola. Возможно, причиной является тот факт, что Ruminiclostridium cellulolyticum – самая целлюлолитическая бактерия, т. е. использует гидролазы для катализа реакций гидролиза целлюлозы.

3 Сравнение протеомов по ключевым словам

Я решила выяснить, сколько раз в каждом из протеомов [1,2] встречаются разные ключевые слова, и сравнить списки 10 самых частых ключевых слов между протеомами. Для этого я использовала программу на языке Python 3.9.

Vescimonas coprocola Ruminiclostridium cellulolyticum
Reference proteome 2426 Reference proteome 3078
Membrane 538 Membrane 732
Transmembrane 519 Transmembrane helix 711
Transmembrane helix 518 Transmembrane 711
Nucleotide-binding 245 Transferase 348
ATP-binding 214 Metal-binding 278
Transferase 212 Hydrolase 277
Metal-binding 205 Nucleotide-binding 263
Cytoplasm 202 ATP-binding 230
Hydrolase 167 Signal 211

Табл. 3. 10 самых частых ключевых слов в протеомах

Самое часто встречающееся ключевое слово - reference proteome, так как протеомы референсные. Также у обеих бактерий часто встречаются слова membrane, transmembrane, transmembrane helix и transferase, что связано с хорошо развитой у них системой мембранных белков (однако у Ruminiclostridium cellulolyticum каждое из перечисленных ключевых слов встречается чаще, чем у Vescimonas coprocola, что подтверждает теорию, описанную в п.2). Еще встречаются ключевые слова nucleotide-binding, ATP-binding и metal-binding, что может указывать на схожий метаболизм у Vescimonas coprocola и Ruminiclostridium cellulolyticum.

4 Сопроводительные материалы

Программа для определения 10-и самых частых ключевых слов в протеоме

5 Литература

  1. Протеом Vescimonas coprocola на сайте UniProt
  2. Протеом Ruminiclostridium cellulolyticum на сайте Uniprot