Практикум 7 (UniProt)

Введение, изучение белка с помощью UniProt

Мне достался белок полифосфат:АДФ-фосфотрансфераза 1 организма Rhizobium meliloti.

полифосфат:АДФ-фосфотрансфераза 1 катализирует реакцию полифосфат-зависимого фосфорилирования АДФ (или ГДФ) в АТФ (или ГТФ) [1].

Встречается в нескольких организмах, в том числе в бактерии Rhizobium meliloti.

Для этого белка известна пространственная структура. Структура с лучшим разрешением (1,87 ангстрем) доступна по идентификатору PDB 6DZG.

В кластерах UniRef100, UniRef90 и UniRef50 для моего белка содержится 5, 22 и 561 белок соответственно, следовательно это достаточно редкий белок (например, в кластере для енолазы E. coli UniRef100 187 белков).

Из запросов в UniProt выяснилось, что этот фермент встречается только у бактерий. Также полифосфат:АДФ-фосфотрансфераза 1 может использовать кроме АДФ другие нуклеозиддифосфаты, причем только у Rhizobium meliloti.

Rhizobium meliloti - грамотрицательная ризосферная бактерия. Является одной из бактерий, фиксирующих азот в клубеньках растений [2]. Несет перитрихальные жгутики, свободно плавает в воде только при низкой плотности клеток [2].

1. Выбор и скачивание протеомов

Для моей бактерии (Rhizobium meliloti) я выбрал ее (именно этого вида) референсный протеом. Идентификатор: UP000001976. Всего белков в протеоме 6169, из них в Swiss-Prot 887. Если смотреть BUSCO, то 100% белков полные, а CPD близок с стандартному (с занижением).

В качестве контроля я выбрал референсный протеом Agrobacterium tumefaciens - организма из того же семейства (Rhizobiaceae), хорошо изученного (т.к. в генетической инженерии растений широко применяется Ti-плазмида из этого вида), однако не симбионтного, а патогенного.

Идентификатор: UP000000813. Всего белков в протеоме 5344, из них в Swiss-Prot 653. Если смотреть BUSCO, то 99,4% белков полные, а CPD стандартный.

В целом я бы сказал, что протеомы примерно одинаковы по степени изученности.

Для скачивания протеомов я использовал команды ниже:

wget 'https://www.uniprot.org/uniprot/?query=proteome:up000001976&format=txt&compress=yes' -O UP000001976.swiss.gz

wget 'https://www.uniprot.org/uniprot/?query=proteome:up000000813&format=txt&compress=yes' -O UP000000813.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

1) Трансмембранные белки

Для нахождения доли трансмембранных белков для моих протеомов я решил воспользоваться следующими поисковыми запросами:

annotation:(type:transmem) AND proteome:up000001976

Найдено 1179 белков, следовательно доля у Rhizobium meliloti - 19%.

annotation:(type:transmem) AND proteome:up000000813

Найден 1061 белок, следовательно доля у Agrobacterium tumefaciens - 20%.

То есть трансмембранных белков почти одинаковая доля.

2) Ферменты

Для нахождения доли ферментов для моих протеомов я решил воспользоваться следующими поисковыми запросами:

ec:* AND proteome:up000001976

Найдено 1647 белков, следовательно доля у Rhizobium meliloti - 27%.

ec:* AND proteome:up000000813

Найдено 797 белов, следовательно доля у Agrobacterium tumefaciens - 15%.

Доля ферментов отличается значительно, что логично, т.к. паразит может позволить себе упростить ферментный комплекс и воспользоваться готовыми веществами от хозяина.

3) Оксидоредуктазы

Для нахождения доли оксидоредуктаз для моих протеомов я решил воспользоваться следующими поисковыми запросами:

ec:1* AND proteome:up000001976

Найдено 423 белка, следовательно доля у Rhizobium meliloti - 7%.

ec:1* AND proteome:up000000813

Найдено 118 белов, следовательно доля у Agrobacterium tumefaciens - 2%.

Доля оксидоредуктаз отличается значительно (причем сильнее, чем доля ферментов в целом - в 3,5 раза), т.к. Rhizobium meliloti - фиксатор азота, а многие вовлеченые в этот процесс белки являются оксидоредуктазами.

3. Сравнение протеомов по долям белков в разных категориях protein existance

Для нахождения количества белков, относящихся к определенной категории подтвержденности использовались следующие команды:

zcat *xxxx* | grep 'PE___y' | wc -l

где xxxx - последние 4 цифры идентификатора, а y - искомая категория подтвержденности, "_" между PE и y обозначает пробел.

В сумме по всем запросам белков было ровно общее количество в протеоме, что подтверждает правильность работы команд. Результат представлен ниже:

Катеория подтвержденности: Rhizobium meliloti Agrobacterium tumefaciens
1 2% 4%
2 0,2% 0,1%
3 39% 39%
4 59% 57%
5 0% 0%

Мы видим, что протеомы очень похожи по подтвержденности существования белков, единственное отличие состоит в большей доле для Agrobacterium tumefaciens белков с экспериментальными подтверждениями на уровне белка. Это скорее всего связано с большей "популярностью" Agrobacterium tumefaciens (его прикладном значении для генной инженерии).

Ссылки на источники:

1. Nocek B, Kochinyan S, Proudfoot M, Brown G, Evdokimova E, Osipiuk J, Edwards AM, Savchenko A, Joachimiak A, Yakunin AF. Polyphosphate-dependent synthesis of ATP and ADP by the family-2 polyphosphate kinases in bacteria. Proc Natl Acad Sci U S A. 2008 Nov 18;105(46):17730-5. doi: 10.1073/pnas.0807563105. Epub 2008 Nov 10. PMID: 19001261; PMCID: PMC2584756.

2. Shin-Ichi Aizawa, Chapter 26 - Sinorhizobium meliloti — Nitrogen–Fixer in the Grassland, Editor(s): Shin-Ichi Aizawa, The Flagellar World, Academic Press, 2014, Pages 82-83, ISBN 9780124172340, https://doi.org/10.1016/B978-0-12-417234-0.00026-8.