Введение
Я выбрала белок YdiU (A0A7L7L4M6) из бактерии Adhaeribacter radiodurans, потому что он представляет интерес сразу с нескольких точек зрения. Во-первых, он относится к редкому классу ферментов — нуклеотидилтрансфераз, которые катализируют необычные посттрансляционные модификации AMPylation и UMPylation. Во-вторых, его аннотация содержит указание на нестандартный кофактор Mn²⁺, тогда как большинство гомологов используют Mg²⁺. В-третьих, белок происходит из малоизученной группы бактерий (Bacteroidetes), что повышает шанс обнаружить функциональные особенности, отсутствующие у модельных организмов. Наконец, при статусе «предсказан по гомологии» он имеет высокий аннотационный балл (4/5), что делает его хорошим кандидатом для будущих экспериментальных исследований.
Поиск гомологов selO у млекопитающих
Запрос в расширенном поиске: gene:selO AND taxonomy_id:40674
Результат: 11 записей
Когда я искала этот запрос, я ожидала увидеть только бактерии. Оказалось, что ген selO есть у млекопитающих, и у человека он называется SELENOO (селенопротеин O).
| Организм | Название белка | Длина (а.о.) | Локализация |
|---|---|---|---|
| Человек (Homo sapiens) | SELO_HUMAN | 669 | митохондрии |
| Мышь (Mus musculus) | SELO_MOUSE | 667 | митохондрии |
| Крыса (Rattus norvegicus) | Selenoprotein O | 666 | митохондрии |
Сравнение с моим белком:
- Мой бактериальный белок: 518 аминокислот
- Человеческий SELENOO: 669 аминокислот (на 151 аминокислоту длиннее)
Вероятно, у эукариот к белку добавились дополнительные домены, которые не нужны бактериям. Например, возможно, появились участки для транспорта в митохондрии или для взаимодействия с другими эукариотическими белками.
Раз у человека есть гомолог, значит функция этого белка (AMPylation / UMPylation) действительно важна для клетки — она сохранялась в эволюции больше миллиарда лет. Мой белок из Adhaeribacter radiodurans — не случайная молекула, а участник фундаментального клеточного процесса.
Поиск AMPylase без аннотированного АТФ-связывания
Мне захотелось проверить, существуют ли в базе UniProt белки с активностью AMPylase (присоединение AMP к белку), у которых при этом отсутствует аннотированная способность связывать АТФ. Это важно для понимания, является ли АТФ-связывание обязательным биохимическим свойством всех AMPylase или существуют исключения.
Запрос в расширенном поиске: (go:0070733) NOT (go:0005524)
Результат выполнения: 224 записи
| Accession | Название белка | Организм | Длина (а.о.) |
|---|---|---|---|
| P39177 | Universal stress protein UP12 (UspG) | Escherichia coli K12 | 142 |
| A0A0V0SJR5 | Protein adenylyltransferase (FICD) | Trichinella nelsoni | 1544 |
| A0A0V1B3U9 | Protein adenylyltransferase (FICD) | Trichinella spiralis | 1608 |
| A0A085MAY3 | Protein adenylyltransferase | Trichuris suis | 4736 |
Выводы:
- Существуют AMPylase без аннотации «ATP binding» — 224 таких белка найдено. Это опровергает гипотезу о том, что все AMPylase обязательно аннотированы как АТФ-связывающие.
- Найденные белки делятся на два типа:
- Бактериальные (например, UspG из E. coli) — короткие белки (100–200 а.о.), у которых отсутствие аннотации ATP binding может отражать реальное отсутствие канонического АТФ-связывающего домена.
- Нематодные (рода Trichinella, Trichuris) — гигантские белки (1500–4700 а.о.), у которых домен AMPylase является лишь частью большой полидоменной структуры.
Поиск экспериментально охарактеризованных гомологов YdiU
Запрос в расширенном поиске: (gene:ydiU) AND (existence:1)
Статусы существования в UniProt:
- 1 — Evidence at protein level (есть экспериментальные данные, например, масс-спектрометрия, кристаллография)
- 2 — Evidence at transcript level (есть данные о мРНК)
- 3 — Inferred from homology (предсказано по гомологии)
- 4 — Predicted (предсказано биоинформатически)
- 5 — Uncertain (нет уверенных доказательств)
Результат выполнения: 4 записи
| Accession | Название белка | Организм | Длина (а.о.) | Статус в UniProt |
|---|---|---|---|---|
| P77649 | Protein nucleotidyltransferase SelO | Escherichia coli K12 | 478 | Reviewed (Swiss-Prot) |
| Q8ZPS5 | Protein nucleotidyltransferase YdiU | Salmonella typhimurium LT2 | 480 | Reviewed (Swiss-Prot) |
| Q87VB1 | Protein nucleotidyltransferase YdiU | Pseudomonas syringae DC3000 | 487 | Reviewed (Swiss-Prot) |
| A0A024L327 | Protein nucleotidyltransferase YdiU | Escherichia coli | 478 | Unreviewed (TrEMBL), но с existence:1 |
Выводы:
- Экспериментально подтверждённые гомологи YdiU существуют, но их мало — всего 4 белка в базе данных. Все они принадлежат классу протеобактерий (E. coli, Salmonella, Pseudomonas).
- Длина экспериментальных гомологов стабильна — 478–487 аминокислотных остатков, что близко к длине моего белка (518 а.о.). Небольшое различие (около 30–40 а.о.) может быть связано с видовой вариабельностью или с дополнительными доменами у белка из Adhaeribacter.
Таким образом, запрос показал, что YdiU — это белок, изученный на модельных протеобактериях, но не на представителях Bacteroidetes. Это открывает перспективу для будущих исследований.
Поиск YdiU с магнием в качестве кофактора, но без марганца
Запрос в расширенном поиске: (gene:ydiU) AND (cc_cofactor_chebi:"CHEBI:18420") NOT (cc_cofactor_chebi:"CHEBI:29035")
Результат выполнения: 41 записи
| Accession | Название белка | Организм | Длина (а.о.) |
|---|---|---|---|
| C1N9G9 | Selenoprotein O | Micromonas pusilla (зелёная водоросль) | 797 |
| A0A2X3JI84 | Putative cytoplasmic protein YdiU | Escherichia coli | 89 |
| A0A2X3LYJ5 | Putative cytoplasmic protein YdiU | Escherichia coli | 223 |
| A0A376J5B4 | Putative cytoplasmic protein YdiU | Escherichia coli | 165 |
| A0A376M734 | Putative cytoplasmic protein YdiU | Escherichia coli | 306 |
Выводы:
- Неожиданное наблюдение: среди результатов есть белок из зелёной водоросли Micromonas pusilla (C1N9G9) длиной 797 а.о. — это означает, что YdiU-подобные белки встречаются не только у бактерий, но и у эукариот (водоросли), и у них также аннотирован магний.
- Большинство находок — фрагменты из E. coli: многие записи имеют длину менее 200 а.о. (например, 44, 55, 61, 72 а.о.). Это, вероятно, неполные последовательности или продукты псевдогенов, что характерно для автоматической аннотации в TrEMBL.