Для выбора наиболее аннотированных белков использовался расширенный поиск в UniProtKB Organism: Borrelia garinii и Annotation score: 4. В результате было найдено 7 вариантов. Пирофосфатаза dITP/XTP проще устроена по сравнению с другими белками и имеет необычные, узконаправленные функции, которые при этом играют немаловажную роль в сохранении генетической информации.
Пирофосфатаза dITP/XTP катализирует гидролиз нуклеозидтрифосфатов до их монофосфатных производных, в основном работает с неканоническим пуриновым нуклеотидам XTP (ксантозинтрифосфат), dITP (дезоксиинозинтрифосфат) и ITP, удаляя неканонические пуриновые нуклеотиды из пула нуклеотидов, тем самым предотвращая их встраивание в ДНК/РНК и избегая хромосомных повреждений.
Использует ионы Mg2+ в качестве кофактора.
Размер кластера UniRef может дать информацию о распространённости белка (сколько организмов его содержат), консервативности последовательности (насколько она устойчива в эволюции) и функциональной важности (высококонсервативные белки часто критичны для выживания).
В UniRef100 size: 1, то есть пирофосфатаза dITP/XTP встречается только у Borrelia garinii. UniRef90: 94, следовательно, белок высоко консервативен (важен для выживания, поэтому изменятся несильно) и широко распространён среди других видов бактерий того же рода. Значение UniRef50: 129 довольно высокое, что может говорить о принадлежности пирофосфатазы dITP/XTP к большому семейству белков, однако конкретная форма не слишком распространена.
Также стоит отметить влияние горизонтально переноса генов на размеры кластеров UniRef. Как следствие может происходить искусственное увеличение размеров кластеров, особенно UniRef50 и UniRef90. Если ген передался без мутаций, то он попадёт в UniRef100 (например, плазмидный ген устойчивости к антибиотикам), если всё же произошли небольшие мутации, то UniRef90, но сильнее всего горизонтальный перенос влияет именно на UniRef50, во-первых, гены, передавшиеся давно, накапливают много мутаций, во-вторых, один ген может быть перенесён в разные группы организмов, создавая ложное впечатление широкой консервативности.
Таким образом, можно предположить, что большие размеры кластеров связаны с горизонтальным переносом гена пирофосфатазы dITP/XTP.
Пирофосфатазы dITP/XTP принадлежит к HAM1 NTPase семейству белков. В UniProtKB с помощью расширенного поиска с выбором Protein family: HAM1 NTPase, Reviewed: Yes было найдено 318 белков (Annotation score: 5 - 9 и 4 - 307). Длина белков: 178-328.
Белки этого семейства встречаются и у модельных организмов: A.thaliana, C.elegans, Fruit fly, Zebrafish, Human, E.coli. Количество записей среди архей: 5%, бактерий: 76% (может быть следствием горизонтального переноса), эукариот: 19%. Метаболизм всех белков связан с гидролизом неканонических пуриновых нуклеотидов, такие как инозинтрифосфат (ITP), дезоксиинозинтрифосфат (dITP) или ксантозин-5'-трифосфат (XTP) до их соответствующих монофосфатных производных.
Далее был выбрать дополнительный параметр Taxonomy: Bacteria (eubacteria) [2] и сгруппировано по параметру Taxonomy (242 записи в Swiss-Prot). Данные показали, что это семейство белков наболее распространено среди таксонов Bacillati и Pseudomonadota. При чём на Spirochaetota (к которому относится Borrelia garinii) приходится только 5%.
Также с помощью Align был рассчитан процент идентичности пирофосфатазы dITP/XTP Borrelia garinii с бактериями из родов Borrelia и Borreliella. С Borreliella burgdorferi и Borreliella afzelii: 94.03%, Borrelia recurrentis: 70.85%, Borrelia duttonii: 71.36%.
У Borrelia garinii к семейству HAM1 NTPase относится только данный белок (organism_name:"Borrelia garinii") AND (family:"HAM1 NTPase").
Для плазмидного генома было получено 3 записи в Swiss-Prot и 558 в TrEMBL (organism_name:"Borrelia garinii") AND (organelle:plasmid). Плазмиды cp26 и lp54 описаны в мини-обзоре. Отдельно для плазмиды cp26: 60 записей в TrEMBL (organism_name:"Borrelia garinii") AND (plasmid:cp26) среди них встретилось 2 белка (ankyrin repeat domain-containing protein и OspC) из 3, которые были описаны в мини-обзоре, как участвующие в реализации болезни Лайма. Для плазмиды lp54: 123 записи в TrEMBL (organism_name:"Borrelia garinii") AND (plasmid:lp54), среди описанных в мини-обзоре встретились OspA, OspB, DbpB, DbpA. Остальные белки были найдены у других видов рода Borrelia. Например, (plasmid:lp54) AND (protein_name:OMS28) у Borreliella afzelii, Borreliella burgdorferi и др. У Borreliella burgdorferi найдены BBA07 family lipoprotein и Lp6.6 family lipoprotein ((plasmid:lp54) AND (taxonomy_name:Borreliella)) AND (reviewed:false) AND (taxonomy_id:224326).
Поисковым запросом: (organism_id:290434) AND (keyword:"virulence") AND (reviewed:true) был найден ещё один белок BptA, ответственный за болезнь Лайма (необходим для выживания бактерии в организме клеща).
Дополнительно было выяснено распределение белков в клетке (organism_id:290434) AND (keyword:"Cellular component") AND (reviewed:true). Оказалось, что цитоплазматических белков аннотировано больше всего.