Анализ белка Cytidine triphosphate synthetase Humibacter sp. BT305
Выбор белка в UniProt, характеристика записи, анализ кластеров UniRef и примеры поисковых запросов.
Выбор белка
Для поиска белков бактерии Humibacter sp. BT305 я использовал расширенный поиск UniProt.
Основной запрос был таким:
organism_name:"Humibacter sp. BT305"
По этому запросу была найдена запись белка CTP synthase (UniProt AC: A0A5B8LYG0, entry name A0A5B8LYG0_9MICO). Я выбрал именно этот белок по нескольким причинам. Во-первых, pyrG кодирует фермент CTP synthase — один из ключевых ферментов биосинтеза пиримидиновых нуклеотидов. Он катализирует превращение UTP в CTP, используя ATP и источник азота, что делает его важным для синтеза РНК и ДНК. Во-вторых, этот белок относится к фундаментальным клеточным ферментам и широко распространён среди бактерий, поэтому для него удобно анализировать UniRef-кластеры и результаты поисковых запросов. В-третьих, запись содержит достаточно подробную аннотацию, включая название белка, ген, таксономию, длину последовательности и молекулярную массу.Информация о белке
Для дальнейшего анализа я перешёл со страницы результатов поиска на страницу белка по accession A0A5B8LYG0, а затем открыл запись в текстовом формате через Download → Format: Text.
Выбранный белок — CTP synthase. Это фермент, участвующий в синтезе цитидинтрифосфата (CTP), одного из основных пиримидиновых нуклеотидов клетки. Белок катализирует ATP-зависимое аминирование UTP до CTP с использованием аммиака или глутамина как источника азота. Таким образом, pyrG играет важную роль в метаболизме нуклеотидов и обеспечении клетки компонентами для синтеза нуклеиновых кислот.
Запись этого белка удобна для анализа, поскольку содержит основные аннотации: название белка, имя гена, таксономическую информацию, длину последовательности, молекулярную массу и ссылки на нуклеотидную запись генома. Кроме того, белок относится к хорошо изученному семейству бактериальных ферментов, поэтому его удобно использовать для анализа кластеров UniRef и поисковых запросов UniProt.
Интересно, что белки семейства CTP synthase являются высококонсервативными, поскольку участвуют в одном из базовых процессов клеточного метаболизма — синтезе нуклеотидов. Благодаря этому подобные белки встречаются у большого числа бактерий и других организмов.
Кластеры похожих белков
Для выбранного белка я нашёл соответствующие кластеры UniRef100, UniRef90 и UniRef50. Кластер UniRef100 для этого белка содержит только 1 последовательность. Это означает, что в базе UniProt не было найдено других полностью идентичных последовательностей, объединённых с данным белком в один 100%-й кластер. В кластере присутствует только сам белок A0A5B8LYG0.
Кластер UniRef90 оказался больше и содержит 9 белков. Это показывает, что у выбранного белка есть несколько очень близких гомологов с уровнем сходства выше 90%. Такие белки встречаются у близкородственных бактерий семейства Microbacteriaceae. Это говорит о хорошей сохранности последовательности pyrG внутри близких таксономических групп. Самым крупным оказался кластер UniRef50, содержащий 6845 записей. Это означает, что более удалённые гомологи белка CTP synthase чрезвычайно широко распространены среди различных организмов. Такой результат вполне ожидаем, поскольку pyrG относится к фундаментальным ферментам биосинтеза нуклеотидов и необходим для нормального функционирования клетки.
Таким образом, сравнение размеров кластеров UniRef100, UniRef90 и UniRef50 показывает, что полностью идентичные варианты белка встречаются редко, близкие гомологи распространены среди родственных бактерий, а более удалённые варианты присутствуют у огромного количества организмов.
Поисковые запросы
Ниже приведены запросы, которые я использовал в расширенном поиске UniProt, а также их цель и результаты.
Запрос 1
organism_name:"Humibacter sp. BT305"
Цель запроса: получить полный набор белков данного организма.
Вывод: запрос позволяет ограничить поиск одним организмом и оценить количество доступных белковых записей для него в UniProt.
Запрос 2
organism_name:"Humibacter sp. BT305" AND gene:pyrG
Цель запроса: найти конкретный белок по имени гена.
Вывод: запрос быстро позволяет найти запись белка CTP synthase без необходимости просматривать весь протеом организма.
Запрос 3
protein_name:"CTP synthase"
Цель запроса: посмотреть распространённость белков CTP synthase в базе UniProt.
Вывод: найдено большое количество белков у разных групп организмов, что подтверждает фундаментальную роль pyrG в клеточном метаболизме.
Вывод
Расширенный поиск UniProt позволяет искать белки по различным типам полей: по организму, имени гена, названию белка, статусу аннотации и другим характеристикам. Это помогает получать более точные результаты и эффективно находить нужные записи. В моём случае такие запросы позволили ограничить поиск организмом Humibacter ginsenosidimutans, выбрать белок pyrG / CTP synthase и провести его дальнейший анализ с использованием текстовой записи UniProt и кластеров UniRef.