Практикум 7

Введение

В данном и последующем практикумах я буду работать с белком фотосистемы 2 с реакционным центром D1 . Белок был найден в Thermosynechococcus vestitus.

Thermosynechococcus vestitus — термофильная цианобактерия. Благоприятной температурой считается 55 градусов по Цельсию. Может переносить экстремальные условия. Также Thermosynechococcus пытаются использовать как утилизатора CO2. В будущем планируют использовать этих бактерий для производства биотоплива и биохимических веществ из CO2.[2]

Белки D1 и D2 образуют реакционное ядро фотосистемы 2 в виде гетеродимера. Это ядро связывается с рядом кофакторов. В результате последовательных процессов происходит расщепление воды с образованием кислорода. Помимо этого главным "продуктом" являютя электроны, которые используются в фотосистеме 1 для превращения CO2 в глюкозу.[1]

Для белка известна пространственная структура в PDB с идентификатором 5OJR, и с разрешением 1.96А.

В кластерах Uniref100, Uniref90, Uniref50 содержится 1, 30, 1825 сответственно. Маленькое колличество белков в Uniref100 говорит о том, что этот белок мало изучен или редкий. Для Uniref100 данный белок является Representative & Seed.

С помощью запросов Uniprot я выяснил, что этот белок встречается не только у данного вида.

1. Выбор и скачивание протеомов

Для бактерии Thermosynechococcus vestitus я выбрал её же референсный протеом с идентификатором UP000000440. Он включает 2451 белков, из которых 494 белка из Swiss-Prot. Судя по BUSCO, протеом содержит 97.3% полноценных генов из 788 кластеров ортологичных генов. А судя по CPD, протеом близок к стандартному.

В качестве контроля я взял референсный протеом E.coli с идентификатором: UP000000558. Он содежит 5062 белка, из которых 2033 из Swiss-Prot. Судя по BUCSO, протеом содержит 100% полноценных генов из 440 кластеров ортологических генов. Протеом стандартный.

Протеом E.coli более изучен, чем протеом Thermosynechococcus vestitus.

Далее скачаем эти протеомы:
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000000440&format=txt&compress=yes' -O ./UP000000440.swiss.gz
wget 'https://www.uniprot.org/uniprot/?query=proteome:UP000000558&format=txt&compress=yes' -O ./UP000000558.swiss.gz

2. Сравнение протеомов по представленности определенных групп белков

a) Трансмембранные белки

С помощью запросов в Uniprot:
для E.coli: annotation:(type:transmem) AND organism:"Escherichia coli O157:H7 [83334]" AND proteome:up000000558,
для T.vestitus: annotation:(type:transmem) AND organism:"Thermosynechococcus vestitus (strain IAM M-273 / NIES-2133 / BP-1) [197221]" AND proteome:up000000440,
я определил колличество трансмембранных белков для каждого протеома.
Для E.coli нашлось 979 трансмембранных белков, следовательно их доля составляет 19.34%
Для T.vestitus нашлось 513 трансмембранных белков, следовательно их доля составляет 20.93%
Как мы можем увидеть доля трансмембранных белков практически равная.

б) Ферменты

Воспользуемся запросами в Uniprot:
для T.vestitus: ec:* AND organism:"Thermosynechococcus vestitus (strain IAM M-273 / NIES-2133 / BP-1) [197221]" AND proteome:up000000440,
для E.coli: ec:* AND organism:"Escherichia coli O157:H7 [83334]" AND proteome:up000000558

Для T.vestitus нашлось 545 белков, следовательно их доля составляет 22.24%
Для E.coli нашлось 1450 белков, следовательно их доля составляет 28.64%

Доля ферментов у E.coli больше. Вероятно, это связано с гетеротрофным типом питания E.coli.

в) Транслоказы

Воспользуемся запросами в Uniprot:
для T.vestitus: ec:7* AND organism:"Thermosynechococcus vestitus (strain IAM M-273 / NIES-2133 / BP-1) [197221]" AND proteome:up000000440,
для E.coli: ec:7* AND organism:"Escherichia coli O157:H7 [83334]" AND proteome:up000000558

Для Для T.vestitus нашлось 26 белков, следовательно их доля составляет 1.06%.
Для E.coli нашлось 67 белка, следовательно их доля составляет 1.32% Доля транслоказ примерно одинаковая.

Первая аминокислота

Как мне известно, у E.coli не все белки начинаются с метионина. Поэтому я решил посмотреть с каких аминокислот начинаются белки у E.coli и T.vestitus. Для этого использовались команды:
zcat UP000000558.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort -u
zcat UP000000440.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | sort -u

В результате — E.coli помимо M, имеет ещё F, K, Q, S, Y. А T.vestitus имеет в начале белков только M.

Ссылки на источники:

1. Nobuo Kamiya, Jian-Ren Shen. Crystal structure of oxygen-evolving photosystem II from Thermosynechococcus vulcanus at 3.7-Å resolution. December 23, 2002.

2. Yuanmei Liang, Jie Tang, Yifan Luo, Michal B Kaczmarek, Xingkang Li, Maurycy Daroch.Thermosynechococcus as a thermophilic photosynthetic microbial cell factory for CO 2 utilisation.2019 Apr.