Мой миниобзор был посвящен геному археи Methanosarcina vacuolata Z-761. Для поиска всех белков данной археи я использовал запрос к базе данных UniProtKB: (taxonomy_name:"Methanosarcina vacuolata Z-761"). В результате нашлось 3478 записей, которые я рассортировал в порядке убывания annotation score(AS). Наиболее высокий AS был равен 4 у 5 белков. Среди них мой выбор пал на 5'-дезоксиаденозиндезаминазу(A0A0E3Q5B4_9EURY), поскульку мне было интересно сравнить этот фермент метаболизма нуклеотидов арехей с таковым у эукариот и бактерий.
5'-дезоксиаденозиндезаминаза(EC=3.5.4.41) – это фермент, который может катализировать целый ряд реакций(1-4), но главным образом он катализирует реакцию 1:
В кластере UniRef100 было найдено 2 записи, в UniRef90 – 25 и в UniRef50 – 84. Выводы о распространенности и консервативности данного фермента по имеющимся данным сделать невозможно, так как на данный момент исследовано мало геномов близкородственных архей. Кроме того, число похожих генов в кластерах не может однозначно говорить об его распространенности, потому что, например, если для какого-нибудь рода известно много геномов его видов, то и число записей попавших в похожие кластеры будет большим, хотя вполне возможно, что данный белок является характерной особенностью только этого рода.
I. Фермент 5'-дезоксиаденозиндезаминаза является продуктом гена dadD. Сколько всего существует записей для этого гена из различных организмов((gene:dadD))? В результате таких записей нашлось 576. Длина найденных белков лежит в пределах от 47 до 668 аминокислотных остатков. Данный разброс весьма существенный. Не очень понятно почему база данных приписала им один и тот же ген. По-видимому, это ошибка автоматических алгоритмов, так как ручного курирования данные записи не проходили. Сколько из этих записей относится к археям((gene:dadD) AND (taxonomy_id:2157)), а сколько к бактериям((gene:dadD) AND (taxonomy_id:2))? По результатам поиска, к археям относятся 462 записи, а к бактериям – 81. К каким же организмам относятся остальные 33 записи? Для этого выполним запрос: (gene:dadD) NOT (taxonomy_id:2157) NOT (taxonomy_id:2). Эти записи относятся либо к эукариотам(высшим растения или настоящим грибам), либо к метагеномным данным.
II. Сколько всего существует белков с названием 5'-дезоксиаденозиндезаминаза? Выполним запрос: (protein_name:"5'-deoxyadenosine deaminase"). Всего нашлось 894 записи. А сколько среди этих белков используют ион цинка в качестве кофактора((protein_name:"5'-deoxyadenosine deaminase") AND (chebi:"CHEBI:29105"))? Оказывается, что цинк используют только 431 белок. Остальные белки плохо аннотированы и про их кофактор ничего не известно.
III. Есть ли среди архей подтвержение существования фермента 5'-дезоксиаденозиндезаминаза на белковом уровне? Для этого выполним запрос: (protein_name:"5'-deoxyadenosine deaminase") AND (taxonomy_id:2157) AND (existence:1). В результате получаем одну запись в Swiss-Prot для фермента археи Methanocaldococcus jannaschii, существование которого было экспериментально подтверждено. Длина этого белка 420 аминокислот. Небольшая разница в длине аминокислот между ферментом Methanocaldococcus jannaschii и Methanosarcina vacuolata Z-761(432 аминокислот) может свидетельствовать об существовании его и у M. vacuolata.