Мой мини-обзор был посвящён архее Halobacterium salinarum NRC-1. С помощью расширенного поиска в базе UniProtKB были найдены 3,468 белков, принадлежащих штамму NRC-1 Halobacterium salinarum (taxonomy_id:64091). Для анализа был выбран белок, обеспечивающий защиту ДНК во время голодания (DNA protection during starvation protein). Он восстанавливает ионы Fe2+ до Fe3+, которые затем хранятся внутри полой сферы, образованной 12 субъединицами белка. Таким образом, он участвует в защите от окислительного стресса, которая рассматривалась в мини-обзоре.
Данный белок в UniRef кластеризуется лишь с 4 такими же белками из нереференсных протеомов H.salinarum. Тем не менее, он, по-видимому, имеет множество гомологов среди различных организмов. Чтобы оценить их распространённость, был использован расширенный поиск в UniProtKB; для отбора необходимых результатов использовалось название белка и таксономическое положение или только таксономическое положение. При поиске белков с таким же названием по всей базе данных было получено 2,435 результатов, из которых 2,195 соответствуют бактериям (taxonomy_id:2), а археям (taxonomy_id:2157) - лишь 198. Это, однако, не позволяет сделать выводов о меньшей распространённости данного белка среди архей – всего для них в базе есть около 2,5 млн записей, в то время как для бактерий – более 100 млн.
Интересно продолжить поиск уже в UniRef, используя название кластера (DNA protection during starvation protein), различные показатели сходства последовательности и таксономическое положение. Для данного белка среди архей выделяется 98 кластеров UniRef90 и 13 кластеров UniRef50. Оказывается, что у H.salinarum белок, обеспечивающий защиту ДНК во время голодания, значительно отличается от своих гомологов: в UniRef50 он находится отдельно от кластера из 413 белков остальных представителей Halobacteriales. Возможно, здесь имел место горизонтальный перенос генов. Для получения более уверенных выводов необходимо использовать специализированные алгоритмы выравнивания.