Выбор белка
В прошлом семестре я делал обзор на геном и протеом бактерии Bacillus velezensis. Сначала, в качестве поискового запроса, я ввел ее название (organism_name: "Bacillus velezensis"). В качестве результата UniProt показал белки принадлежащие 8 штаммам бактерии, у 3 из которых был исследован всего 1 белок. Затем я ввел более точный запрос конкретного штамма, у которого исследовано наибольшее число белков ((taxonomy_id:492670)). Большая часть белков имела низкий уровень аннотации: в основном 1 уровень (12,187 из 16,512). Поэтому далее я решил взять близкородственную бактерию Bacillus pumilus ((taxonomy_id:492670)), у которой более обширный выбор белков (ввел запрос:(organism_name: "Bacillus pumilus")). Меня заинтересовал фермент Subtilisin (ID:”SUBT_BACPU”) (EC=3.4.21.62). Субтилизин представляет собой внеклеточную щелочную сериновую протеазу, он катализирует гидролиз белков и пептидных амидов. Секреция субтилизина связана с началом споруляции (однако субтилизин не является необходимым для нормального спорулирования).
Поисковые запросы
В начале я решил выяснить сколько всего существует записей по названию данного белка ((ec:3.4.21.62)). Нашлось 5,453 результата. Далее я решил узнать, существуют ли такие ферменты у эукариот ((ec:3.4.21.62) AND (taxonomy_id:2759)). Нашлось 4,266 результата, однако у человека этого фермента не обнаружено ((ec:3.4.21.62) AND (taxonomy_id:9606)). Далее я выяснил есть ли белки с таким же названием, но другой классификацией EC ((protein_name:"Subtilisin") NOT (ec:3.4.21.62)). Выяснилось, что такие есть (47,127 результата).
Кластеры
Кластеры похожих белков находятся в файле ~/term2/pr7/protein_clusters.txt