Фермент пантоаткиназа археи Thermococcus kodakarensis (UniProt) (Proteomes) и сравнение её протеома с протеомом Haloferax volcanii (Proteomes)

 

ВВЕДЕНИЕ

Классический бактериальный/эукариотический и архейный пути синтеза 4'-фосфопантотената из пантоата.

Фермент пантоаткиназа (PoK) является ферментом пути биосинтеза кофермента А у архей и катализирует АТФ-зависимое фосфорилирование пантоата с образованием 4'-фосфопантоата. 4'-фосфопантоат является предшественником 4'-фосфопантотената, который получается конденсацией фосфопантоата и β-аланина. Эту реакцию катализирует фосфопантотенатсинтетаза (PPS). Фермент пантоаткиназа относится к классу трансфераз, а его полное название по номенклатуре EC 2.7.1.169. У бактерий и эукариот наоборот ферменты пантотенатсинтетаза (PS) и пантотенаткиназы (PanK) осуществляют сначала конденсацию β-аланина и пантоата (PS), а затем фосфорилирование (PanK). Коэнзим А является важными кофакторами во многих метаболических путях, таких как: цикл трикарбоновых кислот, путь β-окисления и пути биосинтеза жирных кислот и поликетидов. [1]

Штамм Thermococcus kodakarensis KOD1 из группы термококки является гипертермофильной археей (растёт при температуре от 65 до 100 градусов по Цельсию), выделенный из сольфатары на острове Кодакара, Япония, ранее был описан как Pyrococcus sp. Но после накопления последовательностей 16S РНК отряда Thermococcales, архею отнесли к роду Thermococcus. Thermococcus kodakarensis хорошо растёт в лабораторных условиях, архея способна к генетической трансформации, и поэтому стала широко изучаемым экспериментальным модельным видом архей. В 2004 году для неё был секвенирован полный геном, что позволило выявить ранее неизвестные и непредвиденные особенности молекулярной биологии и метаболизма архей. [2][3]

ИЗУЧЕНИЕ ЗАПИСИ БЕЛКА В UNIPROT

Запись о пантоаткиназе имеет идентификатор POK_THEKO в базе данных UniProtKB, у неё один код доступа: Q5JHF1. Как уже было сказано во введении, белок принадлежит архее Thermococcus kodakarensis, а точнее её штамму KOD1, что эквивалентно ATCC BAA-918, JCM 12380. Но, как уже было сказано во введении, штамм сначала отнесли в род Pyrococcus. И поэтому есть и второе название организма Pyrococcus kodakaraensis (штамм KOD1). Также в записи можно найти коды доступа тех нуклеотидных последовательностей в базе данных EMBL, которые послужили основой для создания записи о белке: BAD86330.1 (отдельный ген фермента), AP006878 (полный геном археи). Для белка установлена трёхмерная структура, есть идентификаторы записей в PDB, соответствующие результатам рентгенструктурного анализа с разными разрешениями: 2.70 Å (6JBC) и 2.50 Å (6JBD). Можно отметить, что трёхмерная структура включает 2 цепи, формирующих гомодимер Homo 2-mer - A2. Каждая цепь состоит из 300 аминокислотных остатков с суммарной массой 32750 Да. [4]

КЛАСТЕРЫ UNIREF

Поиск идентификатора POK_THEKO в базе данных UniRef даёт три кластера: UniRef100_Q5JHF1 (1 запись), UniRef90_Q5JHF1 (3 записи) и UniRef50_Q5JHF1 (90 записей).

В кластере UniRef100_Q5JHF1 одна запись из Swiss-Prot.
В кластере UniRef90_Q5JHF1 одна запись (исходная) из Swiss-Prot, одна из TrEMBL, одна из UniParc (архивная). Все три белка этого кластера относятся к разным организмам одного рода.
В кластерах со степенью сходства 100% и 90% рассматриваемый белок является и seed'ом и репрезентативной последовательностью одновременно.
В кластере UniRef50_Q5JHF1 одна запись (исходная) из Swiss-Prot, 79 из TrEMBL, 10 из UniParc (архивные).
В этом кластере последовательность является референсной но seed - другая, более длинная последовательность из 308 аминокислот. Все записи в этом кластере относятся к археям из группы Thermococcales (64 Thermococcus, 11 Pyrococcus, 1 Palaeococcus и 10 неклассифицированных архей (archaeon)). В этом кластере есть одна запись о другом белке (пантотенаткиназа), одно запись о фрагменте пантотенаткиназы, две записи о фрагменте GHMP киназы.

РЕЗУЛЬТАТЫ ЗАПРОСОВ В UNIPROTKB

Поиск по номенклатуре EC 2.7.1.169 "(ec:2.7.1.169)" даёт достаточно много результатов (всего 2049 и 3 в Swiss-Prot). 2 из них (обе в Swiss-Prot) доказано существуют на уровне белков. 2047 записей (с 3 в Swiss-Prot) найдено для домена Архей и 2 архивные записи для бактерии Salinibacter ruber. Для одной записи с нашим идентификатором POK_THEKO получена 3D структура. Для двух записей (Swiss-Prot) показаны оптимумы pH (7,5 и 8,5) и температуры (80 и 40). В 2032 записей (3 из которых Swiss-Prot) есть упоминание Коэнзима А, а для 17 нет.

ИСТОРИЯ ИЗМЕНЕНИЯ ЗАПИСЕЙ В UNIPROT

Я посмотрел три версии (45, 55, 62, 63) записи с идентификатором POK_THEKO и решил подметить некоторые изменения:
В 54-55 идентификатор группы белков IPR012043 изменился с GHMP_arc на PoK.
В 62-63 изменился идентификатор с POK_PYRKO на POK_THEKO, и основное название организма сменилось с Pyrococcus kodakaraensis на Thermococcus kodakaraensis.

ПОИСК ПРОТЕОМОВ И ИХ ПАРАМЕТРЫ

Для штамма Thermococcus kodakaraensis KOD1 есть собственный референсный протеом с идентификатором UP000000536, он включает 2301 белок. С точки зрения BUSCO протеом содержит 100% полноценных генов из 234 кластеров ортологичных генов, а оценка размеров протеома по сравнению с таксономически близкими видами относит его к категории " Close to standard" (количество генов в нём ниже ожидаемого). Если говорить о степени изученности протеома, то протеом хорошо изучен, в Swiss-Prot есть 428 записей.

В качестве второго протеома я выбрал тот, что соответствует архее Haloferax volcanii. Геном Haloferax volcanii полностью отсеквенирован. Выбор был сделан исходя из того, что эта архея типичный представитель группы галоархей, которая близка к группе термококки. Обе археи относятся к типу Эвриархеота, и обе археи экстремофиллы. Thermococcus kodakaraensis это термофильная архея, а Haloferax volcanii – галофильная. Референсный протеом c идентификатором UP000008243 содержит 3921 белков, и он также "Close to standard". Что касается степени изученности, то она несколько ниже, чем у Thermococcus kodakaraensis: в Swiss-Prot 192 записи. Это обусловлено тем, что людей больше интересуют термофилы, из которых можно выделять термостабильные ферменты. [5]

СКАЧИВАНИЕ ПРОТЕОМОВ

Thermococcus kodakaraensis:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28%28proteome%3AUP000000536%29%29' -O ~/term2/pr8/UP000000536.swiss.gz

Haloferax volcanii:

wget 'https://rest.uniprot.org/uniprotkb/stream?compressed=true&format=txt&query=%28%28proteome%3AUP000008243%29%29' -O ~/term2/pr8/UP000008243.swiss.gz

АНАЛИЗ И СРАВНЕНИЕ ПРОТЕОМОВ

Используя запросы я получил:

Для Thermococcus kodakaraensis

Трансмембранные белки (запрос: “(organism_id:69014) AND (proteome:UP000000536) AND (ft_transmem:*)”)
Swiss-prot: 13
Total: 462

Ферменты (запрос: “(organism_id:69014) AND (proteome:UP000000536) AND (ec:*)”)
Swiss-prot: 265
Total: 375

Зависимость от соли (запрос: “(organism_id:69014) AND (proteome:UP000000536) AND salt”)
Swiss-prot: 0
Total: 1

Для Haloferax volcanii

Трансмембранные белки (запрос: “(organism_id:309800) AND (proteome:UP000008243) AND (ft_transmem:*)”)
Swiss-prot: 28
Total: 902

Ферменты (запрос: “(organism_id:309800) AND (proteome:UP000008243) AND (ec:*)”)
Swiss-prot: 114
Total: 953

Зависимость от соли (запрос: “(organism_id:309800) AND (proteome:UP000008243) AND salt”)
Swiss-prot: 28
Total: 28

Обсуждение

Трансмембранные белки
Их количество и изученность хорошо согласуется с параметрами протеомов двух архей.
Ферменты
Их количество также согласуется, но у Haloferax volcanii сильно страдает изученность, по сравнению с Thermococcus kodakaraensis.
Зависимость от соли
Как и ожидалось, у Haloferax volcanii есть много белков, в записях которых есть слово ''соль'', ведь эта архея является галофилом. И мы наблюдаем яркий контраст в сравнении с Thermococcus kodakaraensis: у неё лишь одна запись (малый белок теплого стресса, реагирующий на солевой стресс).

ДАЛЬНЕЙШЕЕ СРАВНЕНИЕ ПРОТЕОМОВ

Я решил сравнить количество записей, в которых есть упоминание зависимости от температуры

Thermococcus kodakaraensis

Зависимость от температуры (запрос: “(organism_id:69014) AND (proteome:UP000000536) AND (cc_bpcp_temp_dependence:*)”)
Swiss-prot: 36
Total: 36
Варианты выдачи (представлены в градусах по Цельсию, в скобках количество записей с такой температурой):
50(1)
60(2)
70(4)
70/75(1) – для прямой и обратной реакции
75(2)
80(6)
85(3)
90(7)
95(3)
95-100(1)
100(1)
Всё ещё активен при 100°C
Активность стабильна при 90°C в течении 30 минут
Оптимум выше 95°C
Высокая термостабильность

Средняя температура по найденным белкам равно примерно 80 градусам по Цельсию. Этого следовало ожидать, так как Thermococcus kodakaraensis является термофильной археей. Здесь выбивается белок Рибозофосфатпирофосфокиназа с относительно низкой температурой (50)

Haloferax volcanii

Зависимость от температуры (запрос: “(organism_id:309800) AND (proteome:UP000008243) AND (cc_bpcp_temp_dependence:*)”)
Swiss-prot: 12
Total: 12
Варианты выдачи (представлены в градусах по Цельсию, в скобках количество записей с такой температурой):
37(1)
40-50(1)
42(2)
45(2)
45-50(1)
45-67(1)
55(1)
55-60(1)
75(2)

А здесь средняя температура представляет примерно 50 градусов по Цельсию. Тут выбиваются две (альфа и бета) субъединицы протеосомы с оптимальной температурой 75 градусов по Цельсию для гидролизующей активности Suc-LLVY-Amc.

С помощью bash я сравнил первые аминокислоты в протеомах обеих архей:

zcat UP000000536.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | uniq -dc
Выдача: 2301 M
zcat UP000008243.swiss.gz | seqret -filter 'swiss::stdin:*[1:1]' | grep -v "^>" | uniq -dc
Выдача: 3921 M

Никаких интересных результатов я не получил, всё стандартно: все белки начинаются с метионина.

Также с помощью bash я сравнил количества белков, относящихся к определенному уровню достоверности существования:

zcat UP000000536.swiss.gz | grep 'PE   ' | wc -l
zcat UP000008243.swiss.gz | grep 'PE   ' | wc -l

Уровень достоверности: Thermococcus kodakaraensis Haloferax volcanii
1 7,8% 2,8%
2 0% 0,3%
3 24,6% 22,6%
4 67,6% 74,3%
5 0% 0%

Мы видим, что протеомы очень похожи по уровню достоверности существования белков, но есть отличия: у Thermococcus kodakaraensis достаточно большая доля белков с экспериментальными подтверждениями на уровне белка (уровень 1).

Ссылки на источники:

1.Pantoate Kinase and Phosphopantothenate Synthetase, Two Novel Enzymes Necessary for CoA Biosynthesis in the Archaea
Yuusuke Yokooji, Hiroya Tomita, Haruyuki Atomi, Tadayuki Imanaka J Biol Chem. 2009 Oct 9; 284(41): 28137–28145. Published online 2009 Aug 7. doi: 10.1074/jbc.M109.009696 PMCID: PMC2788864

2. Microbe Profile: Thermococcus kodakarensis: the model hyperthermophilic archaeon
Haruyuki Atomi, John Reeve Microbiology (Reading) 2019 Nov; 165(11): 1166–1168. Published online 2019 Aug 22. doi: 10.1099/mic.0.000839 PMCID: PMC7137780

3. Description of Thermococcus kodakaraensis sp. nov., a well studied hyperthermophilic archaeon previously reported as Pyrococcus sp. KOD1
Haruyuki Atomi, Toshiaki Fukui, Tamotsu Kanai, Masaaki Morikawa, Tadayuki Imanaka Archaea. 2004 Oct; 1(4): 263–267. Published online 2004 Apr 16. doi: 10.1155/2004/204953

4. Crystal structure of pantoate kinase from Thermococcus kodakarensis.
Kita A, Kishimoto A, Shimosaka T, Tomita H, Yokooji Y, Imanaka T, Atomi H, Miki K. Proteins. 2020 May;88(5):718-724. doi: 10.1002/prot.25852. Epub 2019 Nov 20. PMID: 31697438

5. Haloferax volcanii for biotechnology applications: challenges, current state and perspectives
R. U. Haque, F. Paradisi, T. Allers Appl Microbiol Biotechnol. 2020; 104(4): 1371–1382. Published online 2019 Dec 20. doi: 10.1007/s00253-019-10314-2 PMCID: PMC6985049