В своём мини-обзоре я исследовал бактерию Teridinibacter purpureus - симбионта корабельного червя Bankia Setacea, помогающего этому моллюску разлагать древесину. Принадлежащие исследуемой мной бактерии белки я нашёл в Uniprot с помощью таксономического идентификатора(запрос organism_id: 2731756). Было найдено 38 записей, из которых для анализа я выбрал целлюлазу с идентификатором A0A0D3MCW1_9GAMM, так как счел интересным ее изучение в контексте симбиоза выбранной мной бактерии с корабельным червём.
Данный белок содержит в себе 520 аминокислотных остатков и представляет из себя целлюлазу(относится к классу гидролаз, более конкретно EC:3.2.1.4). Этот фермент катализирует гидролиз бета-1,4-связей в целлюлозе, лихенине и бета-D-глюканах злаков.
С помощью advanced search было выяснено следующее:
1)Было проверено, насколько много записей о целлюлазах существует в Uniprot для таксона Pseudomonadota, к которому и принадлежит Teridinibacter purpureus, как и многие другие бактерии(например протеобактерии)(запрос (ec:3.2.1.4) AND (taxonomy_id:1224)). Это было сделано, чтобы выяснить, является ли целлюлаза распространенным белком у данной группы бактерий. Было получено 6370 результатов, что позволяет судить о довольно широком распространении целлюлаз у бактерий этой группы.
2)К таксону Pseudomonadota принадлежит и Escherichia coli, которая повсеместно используется в биологии и биотехнологии, а значит есть вероятность, что огромное количество записей о целлюлазах это записи о белках из рекомбинантных штаммов E.coli. Чтобы приблизиться к нахождению числа бактерий, обладающих целлюлазой в дикой форме, был проведен поиск записей о целлюлазах в таксоне Pseudomonadota исключая Escherichia coli. В результате по запросу((ec:3.2.1.4) AND (taxonomy_id:1224) NOT (taxonomy_id:562)) получено 6214 записей, что подтверждает достаточно сильную распространенность целлюлаз среди Pseudomonadota.
3)В имеющемся белке обнаружены домены CBM2 и CBM10. Для проверки, являются ли эти домены характерными для целлюлаз Pseudomonadota, были введены соответствующие запросы(а именно (taxonomy_id:1224) AND (ft_domain:CBM2) AND (ec:3.2.1.4) и (taxonomy_id:1224) AND (ft_domain:CBM10) AND (ec:3.2.1.4)). По результатам первого запроса было получено 511 записей, по результатам второго - 77. Из этих результатов можно сделать вывод, что эти домены хоть и встречаются в целлюлазах других Pseudomonadota, не являются особо распространенными(но при этом CBM2 распространён гораздо больше, чем CBM10).