Мне достался белок полифосфат:АДФ-фосфотрансфераза 1 организма Rhizobium meliloti.
полифосфат:АДФ-фосфотрансфераза 1 катализирует реакцию полифосфат-зависимого фосфорилирования АДФ (или ГДФ) в АТФ (или ГТФ) [1].
Встречается в нескольких организмах, в том числе в бактерии Rhizobium meliloti.
Для этого белка известна пространственная структура. Структура с лучшим разрешением (1,87 ангстрем) доступна по идентификатору PDB 6DZG.
В кластерах UniRef100, UniRef90 и UniRef50 для моего белка содержится 5, 22 и 561 белок соответственно, следовательно это достаточно редкий белок (например, в кластере для енолазы E. coli UniRef100 187 белков).
Из запросов в UniProt выяснилось, что этот фермент встречается только у бактерий. Также полифосфат:АДФ-фосфотрансфераза 1 может использовать кроме АДФ другие нуклеозиддифосфаты, причем только у Rhizobium meliloti.
Rhizobium meliloti - грамотрицательная ризосферная бактерия. Является одной из бактерий, фиксирующих азот в клубеньках растений [2]. Несет перитрихальные жгутики, свободно плавает в воде только при низкой плотности клеток [2].
Для моей бактерии (Rhizobium meliloti) я выбрал ее (именно этого вида) референсный протеом. Идентификатор: UP000001976. Всего белков в протеоме 6169, из них в Swiss-Prot 887. Если смотреть BUSCO, то 100% белков полные, а CPD близок с стандартному (с занижением).
В качестве контроля я выбрал референсный протеом Agrobacterium tumefaciens - организма из того же семейства (Rhizobiaceae), хорошо изученного (т.к. в генетической инженерии растений широко применяется Ti-плазмида из этого вида), однако не симбионтного, а патогенного.
Идентификатор: UP000000813. Всего белков в протеоме 5344, из них в Swiss-Prot 653. Если смотреть BUSCO, то 99,4% белков полные, а CPD стандартный.
В целом я бы сказал, что протеомы примерно одинаковы по степени изученности.
Для скачивания протеомов я использовал команды ниже:
wget 'https://www.uniprot.org/uniprot/?query=proteome:up000001976&format=txt&compress=yes' -O UP000001976.swiss.gz
wget 'https://www.uniprot.org/uniprot/?query=proteome:up000000813&format=txt&compress=yes' -O UP000000813.swiss.gz
Для нахождения доли трансмембранных белков для моих протеомов я решил воспользоваться следующими поисковыми запросами:
annotation:(type:transmem) AND proteome:up000001976
Найдено 1179 белков, следовательно доля у Rhizobium meliloti - 19%.
annotation:(type:transmem) AND proteome:up000000813
Найден 1061 белок, следовательно доля у Agrobacterium tumefaciens - 20%.
То есть трансмембранных белков почти одинаковая доля.
Для нахождения доли ферментов для моих протеомов я решил воспользоваться следующими поисковыми запросами:
ec:* AND proteome:up000001976
Найдено 1647 белков, следовательно доля у Rhizobium meliloti - 27%.
ec:* AND proteome:up000000813
Найдено 797 белов, следовательно доля у Agrobacterium tumefaciens - 15%.
Доля ферментов отличается значительно, что логично, т.к. паразит может позволить себе упростить ферментный комплекс и воспользоваться готовыми веществами от хозяина.
Для нахождения доли оксидоредуктаз для моих протеомов я решил воспользоваться следующими поисковыми запросами:
ec:1* AND proteome:up000001976
Найдено 423 белка, следовательно доля у Rhizobium meliloti - 7%.
ec:1* AND proteome:up000000813
Найдено 118 белов, следовательно доля у Agrobacterium tumefaciens - 2%.
Доля оксидоредуктаз отличается значительно (причем сильнее, чем доля ферментов в целом - в 3,5 раза), т.к. Rhizobium meliloti - фиксатор азота, а многие вовлеченые в этот процесс белки являются оксидоредуктазами.
Для нахождения количества белков, относящихся к определенной категории подтвержденности использовались следующие команды:
zcat *xxxx* | grep 'PE___y' | wc -l
где xxxx - последние 4 цифры идентификатора, а y - искомая категория подтвержденности, "_" между PE и y обозначает пробел.
В сумме по всем запросам белков было ровно общее количество в протеоме, что подтверждает правильность работы команд. Результат представлен ниже:
Катеория подтвержденности: | Rhizobium meliloti | Agrobacterium tumefaciens | |
1 | 2% | 4% | |
2 | 0,2% | 0,1% | |
3 | 39% | 39% | |
4 | 59% | 57% | |
5 | 0% | 0% |
Мы видим, что протеомы очень похожи по подтвержденности существования белков, единственное отличие состоит в большей доле для Agrobacterium tumefaciens белков с экспериментальными подтверждениями на уровне белка. Это скорее всего связано с большей "популярностью" Agrobacterium tumefaciens (его прикладном значении для генной инженерии).
1. Nocek B, Kochinyan S, Proudfoot M, Brown G, Evdokimova E, Osipiuk J, Edwards AM, Savchenko A, Joachimiak A, Yakunin AF. Polyphosphate-dependent synthesis of ATP and ADP by the family-2 polyphosphate kinases in bacteria. Proc Natl Acad Sci U S A. 2008 Nov 18;105(46):17730-5. doi: 10.1073/pnas.0807563105. Epub 2008 Nov 10. PMID: 19001261; PMCID: PMC2584756.
2. Shin-Ichi Aizawa, Chapter 26 - Sinorhizobium meliloti — Nitrogen–Fixer in the Grassland, Editor(s): Shin-Ichi Aizawa, The Flagellar World, Academic Press, 2014, Pages 82-83, ISBN 9780124172340, https://doi.org/10.1016/B978-0-12-417234-0.00026-8.