UniProt

Выбор белка

Поиск белка производился в UniProtKB, дополнительными параметрами выступили:
1) Taxonomy: Campylobacter coli (--> 41540 белков);
2) Хорошая аннотированность (--> 217 белков, их кол-во сократилось)
Максимальная оценка аннотированности для данной бактерии - 4 (Inferred from homology).
Я решила выбрать CTP synthase (ID: A0A1T1ZJP7_CAMCO, AC: A0A1T1ZJP7), перед этим дополнительно указав критерий «Activity regulation» для дополнительного сокращения выборки. К сожалению, белок не был проверен кураторами (т.е. не принадлежит к Swiss-Prot), однако аннотированность, как было сказано ранее, составляет 4/5.

CTP
Рис. 1. Структура CTP synthase, предсказанная AlphaFold. Визуализировано с помощью PyMOL. Зеленым цветом окрашены альфа-спирали, фиолетовым - бета-листы.

Информация о белке

Основная информация о белке:
Database:TrEMBL
ID:A0A1T1ZJP7_CAMCO
AC:A0A1T1ZJP7
Version:21
Name:CTP synthase
TaxID:195
INSDC:MPIX01000015
Length:544
MW:60321

CTP-синтаза (Cytidine Triphosphate Synthase (CTPS), CTP synthase) катализирует АТФ-зависимое аминирование UTP до CTP либо с L-глютамином, либо с аммиаком в качестве источника азота, а также егулирует внутриклеточные уровни CTP посредством взаимодействия с четырьмя рибонуклеотидтрифосфатами.

Каталитическая активность:
[1] ATP + H2O + L-glutamine + UTP = ADP + CTP + 2 H+ + L-glutamate + phosphate
[2] ATP + NH4+ + UTP = ADP + CTP + 2 H+ + phosphate
[3] H2O + L-glutamine = L-glutamate + NH4+

Кластеры похожих белков

Ниже приведены результаты поиска кластеров похожих белков:

CTP
Рис. 2. Результаты поиска кластеров похожих белков в UniRef.


Поиск производился в UniRef по AC белка. Их, как и должно быть, 3: Uniref100, генерирующийся путем кластеризации идентичных последовательностей и подфрагментов, UniRef90, создающийся кластеризацией исходных последовательностей UniRef100 и UniRef50, создающийся путем кластеризации последовательностей уже UniRef90.
Белок является достаточно распространённым (об этом говорит хотя бы количество участников внутри кластеров UniRef90 и UniRef50. Консервативность белка определяется по количеству одинаковых аминокислот в аналогичных частях других белков, однако я не уверена, что такого анализа кластеров достаточно для отнесения обозреваемого белка к консервативным/не консервативным.

Поисковые запросы

[1] Для начала найдем CTP-синтазу среди Campylobacter coli:
(protein_name:"CTP synthase") AND (taxonomy_id:195)
Результат: 21

[2] Ранее я писала мини-обзор Campylobacter coli – бактерии из рода Campylobacter. Мне стало интересно, как хорошо изучена CTP-синтаза у родственников моей бактерии – вида Campylobacter jejuni.
(protein_name:"CTP synthase") AND (taxonomy_id:197)
Резульат: 63.
Campylobacter jejuni считается более изученным видом, “эталоном” рода, и это подтверждается (лишь отчасти, так как на основании одного белка такие выводы делать нельзя) результатами запроса: тот же белок в этом таксоне изучен лучше.

[3] У рассматриваемого белка есть сайт связывания иона магния. Можно посмотреть, какие белки в принципе обладают тем же сайтом связывания:
ft_binding:"CHEBI:18420"
Результат: 2344122

[4] Сузим выборку, выбрав только бактерий:
(ft_binding:"CHEBI:18420") AND (taxonomy_id:2)
Результат: 2114650
Как можно заметить, у бактерий представленность высока.

[5] Вновь сузим выборку до рода Campylobacter:
(ft_binding:"CHEBI:18420") AND (taxonomy_id:2) AND (taxonomy_id:194)
Результат: 10155
Доля бактерий рода Campylobacter, таким образом, крайне мала.

[6] Для сравнения сделаем дополнительный запрос:
(ft_binding:"CHEBI:18420") AND (taxonomy_id:2) NOT (taxonomy_id:195)
Результат: 2113679.
Это - количество бактерий НЕ из рода Campylobacter со способностью связывать магний.

Соотношение [6] и [4] показывет, что 99,54% бактерий, имеющих сайт связывания магния не относятся к роду Campylobacter.

[7] Среди результатов [5] – лишь 17 c PE (Protein Evidence) “Evidence at protein level”
(ft_binding:"CHEBI:18420") AND (taxonomy_id:2) AND (taxonomy_id:194) AND (existence:1)
Этот запрос опять же подтверждает лучшую изученность Campylobacter jejuni: все найденные здесь белки относятся к этому виду.

[8] Далее я решила выяснить, может ли CTP-синтаза участвовать в формировании каких-либо заболеваний. Было решено производить поиск вне Бактерий.
(protein_name:"CTP synthase") AND (cc_disease:*)
Результат: 1.
Белок (точнее – его дефицит) действительно влияет на возникновение Иммунодефицита 24 (IMD 24). Болезнь вызывается вариантами, поражающими ген, представленный в этой записи. Уникальная и рецессивная мутация G на C, вероятно, затрагивающая донорский сайт сплайсинга на стыке интрона 17-18 и экзона 18, была идентифицирована у всех пациентов. Это приводит к экспрессии аномального транскрипта без экзона 18 и полной потере экспрессии белка.

[9] Также я посмотрела, какие эффекты могут быть вызваны нарушением работы гена, кодирующего CTP-синтазу.
(protein_name:"CTP synthase") AND (cc_disruption_phenotype:*)
Результатов: 2.
В лактококках Lactococcus lactis cremoris (второй результат) клетки, лишенные этого гена, нуждаются в цитидине для роста, что доказывает, что у L. lactis продукт pyrG является единственным ферментом, ответственным за аминирование UTP в CTP.

Поиск источника аннотации

Я выбрала 3 «факта» о своём белке:
[1] Имя файла в другой базе данных

CTP
[2] Pathway
CTP
[3] Domain
CTP

[1] EnsemblBacteria - сюда перенаправляет база данных EMBL-EBI. На сайте указан ген: BOQ02_08615 - кодировка белка в базе данных ENA (разобрана далее). Там же (ENA), во вкладке Navigation&CrossReferences можно найти ссылки на другие достоверные источники, включая UniProt.
CTP
Рис. 3. Интерфейс EnsemblBacteria.
Этот источник аннотирован ENA, мне кажется, ему можно доверять.

[2] HAMAP - второй источник. Основная информация о белке с сайта представлена ниже:
CTP
Рис. 4. Интерфейс HAMAP.
Общую информацию о белке обновляли 19 ноября 2022 года, то есть совсем недавно, а обновление данных было произведено 10 мая 2017 года. Здесь же есть ссылки на иные источники:
1. QuickGo. Здесь указываются перекрестные ссылки, межонтологические отношения, карты предков (приведены ниже):
CTP
Рис. 5.Карта предков (ancestor chart) для GO:0003883 (CTP synthase activity).
CTP
Рис. 6. Карта предков для GO:0006221 (pyrimidine nucleotide biosynthetic process).
2. RHEA. Здесь указана основная информация, особенности белка, реакции, катализируемые им (например, гидролиз глутамина).
Учитывая всё вышеперечисленное, данные, как мне кажется, можно считать достоверными.

[3] Pfam - база-участник (member database) InterPro. Тут же есть ссылка на базу данных ENA, где есть файлы с нуклеотидной последовательностью, также - на InterPro и на статью, в которой обозревается исследуемый белок. Статья была опубликована в 2003 году, данные в ней нельзя считать достоверными на 100%, они требуют перепроверки. В остальном, сайт предоставляет новую информацию, которая, судя по отчетам, обновляется и соответствует действительности.