Данный белок был выбран с помощью Advanced поиска UniProtKB. Был вбит запрос (taxonomy_id:488731). Среди высветившихся белков были только три с аннатированностью выше 3. Из оставшихся вариантов была выбрана пируватдегидрогеназа, потому что я хорошо понимаю ее механизм функционирования и роль (ID записи: A0A8A8DBA0_9BURK).
Пируватдегидрогеназа это мембранный белок, который катализирует реакцию окислительного декарбоксилирования пирувата до ацетил-КоА и углекислого газа, а также переносит электроны из цитоплазмы в дыхательную цепь с помощью убихинона.
Ссылка на отчётный файлПервым делом была оценена распространенность данного белка. При запросе (protein_name:"Pyruvate dehydrogenase") выдается 170 746 результатов. Количество данных об этом белке довольно немаленькое. Действительно, ведь он выполняет очень важную роль в клетке. Но при таком поиске выдаются довольно разные результаты, а именно прокариотные и эукариотные пируватдегидрогеназы, их разные изоформы (PDK1, PDK2, PDK3 и т.д.). Я решил разобраться какие из изоформы характерны для разных супердоменов.
(protein_name:"Pyruvate dehydrogenase") AND (taxonomy_name:2)(это ID бактерий). Выдает 143 714 результата принадлежит бактериям.
(protein_name:"Pyruvate dehydrogenase") AND (taxonomy_id: 2759)( это ID эукариот). При этом 23 954 принадлежит эукариотам.
(protein_name:"Pyruvate dehydrogenase") AND (taxonomy_id:2157)(ID архей). 2 084 результатов принадлежит археям.
Но 143 714 + 23 954 + 2 084 = 169 212, а это не равно 170 746. Чтобы раскрыть какому мистическому таксону принадлежат оставшиеся результаты я провел поиск по следующему фильтру:
(protein_name:"Pyruvate dehydrogenase") NOT (taxonomy_id:2759) NOT (taxonomy_id:2) NOT (taxonomy_id:2157).
Выдало 994 результата. Среди этих результатов можно обнаружить некоторые, ошибочно неотнесенные к бактериям: например, Streptomyces albulus и Weizmannia sp. JC-7. Но самое интересное открытие для меня заключалось в том, что остальные результаты были отнесены к метагеномам: метагеномам горячих источников, морским, растительным и водным (freshwater) и т.д. До этого я не знал о присутствии метагеномов в UniProt. Итого получается 169 212 + 994 = 170 206. В связи с обнаружением неточностей и моим иссякающим энтузиазмом, оставшиеся необнаруженные результаты можно списать на ошибочно неотнесенные к нужному таксону записи.
(protein_name:"Pyruvate dehydrogenase [ubiquinone]") NOT (taxonomy_id:2) NOT (protein_name:component). Выдает 8 результатов, относящихся к метагеномам. Таким образом, Pyruvate dehydrogenase [ubiquinone]" – форма характерная почти исключительно для прокариот.
(protein_name:"Pyruvate dehydrogenase") AND (taxonomy_id:2759) AND (gene:PDK1). Пируватдегидрогеназа закодированная геном PDK1.