Практикум 7. UniProt

Бактерия: Carboxydocella thermautotrophica

Белок: Бифункциональный белок GlmU (N-ацетилглюкозамин-1-фосфат-уридилилтрансфераза / глюкозамин-1-фосфат-ацетилтрансфераза)

UniProt AC: A0A2R4MWP3

1. Выбор белка

С помощью расширенного поиска в UniProt по организму Carboxydocella thermautotrophica я нашла несколько белков этой бактерии. Для анализа выбрала белок A0A2R4MWP3 — бифункциональный фермент GlmU, который показался мне наиболее интересным благодаря своей роли в синтезе клеточной стенки.

Почему он:

2. Информация о белке

Как получены данные

Текстовая запись скачана командой wget с UniProt. Из неё вручную извлечены значения для файла protein_info.txt: идентификаторы, таксономия, длина и молекулярная масса.

Перевод названия и классификация

Рекомендуемое название (RecName): бифункциональный белок GlmU.

Компоненты:

Ген: glmU

Функция белка

GlmU катализирует две последовательные реакции в пути биосинтеза УДФ-N-ацетилглюкозамина (UDP-GlcNAc). Это вещество — ключевой предшественник пептидогликана, из которого строится клеточная стенка бактерий:

  1. Ацетилтрансферазная реакция (C-концевой домен): перенос ацетильной группы с ацетил-КоА на глюкозамин-1-фосфат → образуется N-ацетилглюкозамин-1-фосфат.
  2. Уридилилтрансферазная реакция (N-концевой домен): перенос уридиловой группы с УТФ на N-ацетилглюкозамин-1-фосфат → образуется UDP-GlcNAc.

Без этого белка бактерия не может строить клеточную стенку, поэтому он считается жизненно важным.

Основные характеристики

3. Кластеры UniRef

Кластеры найдены через поиск UniRef на сайте UniProt (вкладка UniRef, запрос A0A2R4MWP3). Оказалось, что мой белок не является репрезентативным ни в одном из кластеров — репрезентативным выбран белок из Carboxydocella sporoproducens (A0A1T4QIC0), а для UniRef50 — белок из Carboxydothermus hydrogenoformans (Q3AFM0).

КластерРазмер (число белков)Длина репрезентативной последовательности
UniRef100_A0A1T4QIC02462
UniRef90_A0A1T4QIC03462
UniRef50_Q3AFM056446

Что это значит:

4. Поисковые запросы

Запрос 1: GlmU внутри рода Carboxydocella

gene:glmU AND taxonomy:"Carboxydocella"

Находок: 2

Зачем: проверить, сколько копий гена glmU у разных видов рода. Оказалось, что у каждого вида по одному белку, то есть ген присутствует в единственной копии. Это ожидаемо для жизненно важного фермента.

Запрос 2: GlmU у термофилов

gene:glmU AND taxonomy:"Thermophilic bacteria"

Находок: 37

Зачем: понять, насколько GlmU распространён среди термофилов. Оказалось, что довольно широко — белок найден у 37 видов из разных групп. Значит, путь синтеза UDP-GlcNAc работает и при высоких температурах без принципиальных изменений.

Запрос 3: Экспериментальные данные по мутагенезу

gene:glmU AND annotation:(type:mutagenesis)

Находок: 8

Зачем: узнать, изучали ли GlmU экспериментально. Нашлось 8 записей, где проводили мутагенез активных остатков. В основном это работы на Escherichia coli и Mycobacterium tuberculosis. Для нашего белка таких данных нет — он аннотирован только по гомологии. Это показывает, что термофильная версия GlmU пока не привлекала внимания экспериментаторов, и здесь есть простор для исследований.