Белок: Aspartate-semialdehyde dehydrogenase (аспартат-полуальдегиддегидрогеназа) из Euzebya pacifica
UniProt ID: A0A346XSX4
Для поиска белков Euzebya pacifica я использовала расширенный поиск на сайте UniProt с запросом: organism:"Euzebya pacifica". Всего было найдено несколько сотен записей. Я выбрала белок A0A346XSX4 (аспартат-полуальдегиддегидрогеназа), так как он имеет хорошую аннотацию.
Название: Aspartate-semialdehyde dehydrogenase → аспартат-полуальдегиддегидрогеназа
Функция: Катализирует NADPH-зависимое образование L-аспартат-полуальдегида из L-аспартил-4-фосфата.
Длина: 352 аминокислоты
Молекулярная масса: 37293 Да
Структура: Функционирует как гомодимер. Содержит NAD(P)-связывающий домен (положения 11-127).
Активный сайт: остатки Cys138 (ацил-тиоэфирный интермедиат) и Glu263 (протонный акцептор).
Участвует в биосинтезе: лизина (DAP путь), треонина, метионина.
| Кластер | Размер (Size) | Длина (Length) |
|---|---|---|
| UniRef100 | 1 | 352 |
| UniRef90 | 1 | 352 |
| UniRef50 | 59 | 352 |
Вывод: Отсутствие других белков в кластерах UniRef100 и UniRef90 говорит о том, что данная последовательность аспартат-полуальдегиддегидрогеназы уникальна для Euzebya pacifica и не имеет близких гомологов в других организмах. Но наличие 59 гомологов в кластере UniRef50 указывает на то, что белок имеет отдалённых гомологов у других бактерий, т.к фермент участвуют в фундаментальном метаболическом пути.
Запрос: protein_name:"Aspartate-semialdehyde dehydrogenase" AND organism_id:2
Результат: Несколько сотен записей
Вывод: Фермент широко распространён среди бактерий, что подтверждает его важную роль в метаболизме.
Запрос: go:0003942 AND reviewed:true
Результат: 421 запись
Вывод: GO-термин 0003942 соответствует аспартат-полуальдегиддегидрогеназной активности. 421 проверенный белок в Swiss-Prot имеют такую же молекулярную функцию.
Запрос: (taxonomy_id:1608957) AND (keyword:KW-0143)
Результат: 25 записей
Вывод: У Euzebya pacifica найдено 25 белков-шаперонов, что характерно для бактерий, адаптированных к различным условиям среды.
protein_info.txt — информация о белке в формате UniProt
protein_clusters.txt — кластеры UniRef100, UniRef90, UniRef50