ИНформация конкретно про тот вид бактерий (Peteryoungia desertarenae),
о котором я делал обзор, недостаточна для выбора белка: нет раздела "Related UniProtKB entries".
Весь род бактерий представлен там всего одной полноценной записью (о виде Peteryoungia ipomoeae).
Я нашёл упомянание о Peteryoungia desertarenae в базе Uniref.
Я скачал файл с аннотацией всех белков и при помощи скрипта
проверил совпадение этих белков с хорошо аннотированными белками Peteryoungia ipomoeae.
Результат оказался отрицательным: совпадающих белков нет.
Таким образом, я вынужден рассмотреть один из белков, принадлежущих данному виду. Непосредственно при выборе белка я полагался на его аннотированность. Всего в геноме данного организма закодирован 4091 белок. Все они имею статус Unreviewed. 11 белков имеют Annotation Score 4 - самый высокий у данной бактерии. Я выбрал Dual-specificity RNA methyltransferase RlmN, поскольку о нём в базе больше всего информации.
Данный белок называется Dual-specificity RNA methyltransferase RlmN (РНК-метилтрансфераза двойной специфичности RlmN)
Этот белок выполняет следующие функции:
- Осуществляет специфическое метилирование двух позиций: аденина 2503 в 23S рРНК и аденина 37 в тРНК. Модификация аденина 2503 улучшает точность работы рибосомы и играет важную роль в контроле на пептидильном трансферазном центре. - Белок использует S-аденозил-L-метионин как источник метильной группы для катализа метилирования.Для оценки распространённости белка я составил следующий запрос: (protein_name:"Dual-specificity RNA methyltransferase RlmN") NOT (taxonomy_id:1210932). Он выдал 38 553 результата, что говорит о том, что белок вполне распространённый. При том 637 записей помечены как Reviewed и, соответственно, находсятся в Swiss-Prot, что говорит о неплохой аннотированности данного белка. К сожалению, запись о моём белке туда не попадает.
Мне стало интересно, может ли этот белок содержаться не в эубактериях. По запросу (protein_name:"Dual-specificity RNA methyltransferase RlmN") NOT (taxonomy_id:2) я получил ответ: да, может. Однако таких белков относительно немного (259), и все записи об этом крайне плохо аннотированы - максимальный Annotation Score всего 2.