Анализ белка YdiU (A0A7L7L4M6) из бактерии Adhaeribacter radiodurans

Мисюрёва Анастасия | Факультет биоинженерии и биоинформатики МГУ

Введение

Я выбрала белок YdiU (A0A7L7L4M6) из бактерии Adhaeribacter radiodurans, потому что он представляет интерес сразу с нескольких точек зрения. Во-первых, он относится к редкому классу ферментов — нуклеотидилтрансфераз, которые катализируют необычные посттрансляционные модификации AMPylation и UMPylation. Во-вторых, его аннотация содержит указание на нестандартный кофактор Mn²⁺, тогда как большинство гомологов используют Mg²⁺. В-третьих, белок происходит из малоизученной группы бактерий (Bacteroidetes), что повышает шанс обнаружить функциональные особенности, отсутствующие у модельных организмов. Наконец, при статусе «предсказан по гомологии» он имеет высокий аннотационный балл (4/5), что делает его хорошим кандидатом для будущих экспериментальных исследований.

Поиск гомологов selO у млекопитающих

Запрос в расширенном поиске: gene:selO AND taxonomy_id:40674

Результат: 11 записей

Когда я искала этот запрос, я ожидала увидеть только бактерии. Оказалось, что ген selO есть у млекопитающих, и у человека он называется SELENOO (селенопротеин O).

ОрганизмНазвание белкаДлина (а.о.)Локализация
Человек (Homo sapiens)SELO_HUMAN669митохондрии
Мышь (Mus musculus)SELO_MOUSE667митохондрии
Крыса (Rattus norvegicus)Selenoprotein O666митохондрии

Сравнение с моим белком:

Вероятно, у эукариот к белку добавились дополнительные домены, которые не нужны бактериям. Например, возможно, появились участки для транспорта в митохондрии или для взаимодействия с другими эукариотическими белками.

Раз у человека есть гомолог, значит функция этого белка (AMPylation / UMPylation) действительно важна для клетки — она сохранялась в эволюции больше миллиарда лет. Мой белок из Adhaeribacter radiodurans — не случайная молекула, а участник фундаментального клеточного процесса.

Поиск AMPylase без аннотированного АТФ-связывания

Мне захотелось проверить, существуют ли в базе UniProt белки с активностью AMPylase (присоединение AMP к белку), у которых при этом отсутствует аннотированная способность связывать АТФ. Это важно для понимания, является ли АТФ-связывание обязательным биохимическим свойством всех AMPylase или существуют исключения.

Запрос в расширенном поиске: (go:0070733) NOT (go:0005524)

Результат выполнения: 224 записи

AccessionНазвание белкаОрганизмДлина (а.о.)
P39177Universal stress protein UP12 (UspG)Escherichia coli K12142
A0A0V0SJR5Protein adenylyltransferase (FICD)Trichinella nelsoni1544
A0A0V1B3U9Protein adenylyltransferase (FICD)Trichinella spiralis1608
A0A085MAY3Protein adenylyltransferaseTrichuris suis4736

Выводы:

  1. Существуют AMPylase без аннотации «ATP binding» — 224 таких белка найдено. Это опровергает гипотезу о том, что все AMPylase обязательно аннотированы как АТФ-связывающие.
  2. Найденные белки делятся на два типа:
    • Бактериальные (например, UspG из E. coli) — короткие белки (100–200 а.о.), у которых отсутствие аннотации ATP binding может отражать реальное отсутствие канонического АТФ-связывающего домена.
    • Нематодные (рода Trichinella, Trichuris) — гигантские белки (1500–4700 а.о.), у которых домен AMPylase является лишь частью большой полидоменной структуры.

Поиск экспериментально охарактеризованных гомологов YdiU

Запрос в расширенном поиске: (gene:ydiU) AND (existence:1)

Статусы существования в UniProt:

Результат выполнения: 4 записи

AccessionНазвание белкаОрганизмДлина (а.о.)Статус в UniProt
P77649Protein nucleotidyltransferase SelOEscherichia coli K12478Reviewed (Swiss-Prot)
Q8ZPS5Protein nucleotidyltransferase YdiUSalmonella typhimurium LT2480Reviewed (Swiss-Prot)
Q87VB1Protein nucleotidyltransferase YdiUPseudomonas syringae DC3000487Reviewed (Swiss-Prot)
A0A024L327Protein nucleotidyltransferase YdiUEscherichia coli478Unreviewed (TrEMBL), но с existence:1

Выводы:

  1. Экспериментально подтверждённые гомологи YdiU существуют, но их мало — всего 4 белка в базе данных. Все они принадлежат классу протеобактерий (E. coli, Salmonella, Pseudomonas).
  2. Длина экспериментальных гомологов стабильна — 478–487 аминокислотных остатков, что близко к длине моего белка (518 а.о.). Небольшое различие (около 30–40 а.о.) может быть связано с видовой вариабельностью или с дополнительными доменами у белка из Adhaeribacter.

Таким образом, запрос показал, что YdiU — это белок, изученный на модельных протеобактериях, но не на представителях Bacteroidetes. Это открывает перспективу для будущих исследований.

Поиск YdiU с магнием в качестве кофактора, но без марганца

Запрос в расширенном поиске: (gene:ydiU) AND (cc_cofactor_chebi:"CHEBI:18420") NOT (cc_cofactor_chebi:"CHEBI:29035")

Результат выполнения: 41 записи

AccessionНазвание белкаОрганизмДлина (а.о.)
C1N9G9Selenoprotein OMicromonas pusilla (зелёная водоросль)797
A0A2X3JI84Putative cytoplasmic protein YdiUEscherichia coli89
A0A2X3LYJ5Putative cytoplasmic protein YdiUEscherichia coli223
A0A376J5B4Putative cytoplasmic protein YdiUEscherichia coli165
A0A376M734Putative cytoplasmic protein YdiUEscherichia coli306

Выводы:

  1. Неожиданное наблюдение: среди результатов есть белок из зелёной водоросли Micromonas pusilla (C1N9G9) длиной 797 а.о. — это означает, что YdiU-подобные белки встречаются не только у бактерий, но и у эукариот (водоросли), и у них также аннотирован магний.
  2. Большинство находок — фрагменты из E. coli: многие записи имеют длину менее 200 а.о. (например, 44, 55, 61, 72 а.о.). Это, вероятно, неполные последовательности или продукты псевдогенов, что характерно для автоматической аннотации в TrEMBL.