Так как встроенный поиск в UniProt обладает низкой точностью, я использовал расширенный поиск (Advanced Search), указав в поле OS (Organism) исследуемую мною ранее архею Haloprofundus salinisoli. Поиск по UniProtKB не дал результатов, в то время как в UniParc нашлось 3419 последовательностей. Я решил поискать другие археи из этого рода, набрав в поиске запрос по Haloprofundus [1911573]. Из 6745 только 9 последовательностей имели уровень аннотированности равный четырём. Последовательностей с наивысшим уровнем аннотированности не было. Все эти последовательности принадлежали автоматической базе данных TrEMBL. Мне приглянулась самая длинная последовательность из списка (730 AA) — бифункциональный белок каталаза-пероксидаза (KatG), принадлежащий Haloprofundus sp. MHR1.
Согласно описанию белка, каталаза-пероксидаза — это фермент одновременно с каталазной и пероксидазной активностью широкого спектра действия. Интересным моментом является причина образования подобного фермента, обладающего сразу двумя функциями. Пероксид водорода, который образуется в процессе аэробного дыхания, является токсичным веществом, поэтому его быстрое и полное удаление из клетки имеет важное значение для ее выживания. Вероятно, для этого в клетках возникли ферменты, способные не только разлагать пероксид, но и использовать различные доноры электронов для этого процесса [1].
Мне стало интересно, у каких организмов вообще встречается каталаза-пероксидаза. Интуитивно кажется, что у развитых эукариот подобный фермент должен встречаться редко. Я решил это проверить при помощи поисковой строки. Сначала я решил проверить наличие данного белка у представителей ядерных. Поисковой запрос (protein_name:Catalase-peroxidase) AND (taxonomy_id:2759) дал 1252 результата. Главным образом, это были грибы (например, Aspergillus fumigatus). Чтобы проверить, все ли эукариоты, содержащие каталазу-пероксидазу являются грибами, я сделал запрос (protein_name:Catalase-peroxidase) AND (taxonomy_id:2759) NOT (taxonomy_id:4751). Результатом были 136 последовательностей. Оказалось, что фермент наблюдается и у других ядерных организмов, например у нематод. Запрос (protein_name:Catalase-peroxidase) NOT (taxonomy_id:2759) показал, что случаев, когда фермент встречается у прокариот, в разы больше: 25684 последовательностей. Из них 24887 принадлежат различным видам бактерий (Запрос: (protein_name:Catalase-peroxidase) AND (taxonomy_id:2)). Поискав информацию в научных статьях, я выяснил, что подавляющее число известных в настоящее время типов KatG закодированы в геномах бактерий, и большинство исследований было проведено на примере бактерий и архей. KatG у ядерных (встречаются, в основном, у грибов и простейших) изучены гораздо меньше [1]. Далее мне захотелось проверить, насколько хорошо аннотированные последовательности каталаз-пероксидаз. Последовательность, изучаемая мною, имела четвертый уровень, но интересно, сколько таких белков будут иметь высший уровень. Запрос (protein_name:Catalase-peroxidase), отфильтрованный по показателю Annotation score равному 5, выдал всего лишь 18 результатов. После этого мне стало любопытно, сколько записей о каталазах-пероксидазах было сделано в UniProtKB до моего рождения. Поисковой запрос (protein_name:Catalase-peroxidase) AND (date_created:[* TO 2004-10-10]) показал 170 результатов. Это составляет порядка 0,63% от всех записей про эти ферменты.