Исследование белка по базам данных UniProtKB и UniRef

Задание 1

Чтобы выбрать белок моей бактерии, я нашла Taxonomy ID Achromobacter xylosoxidans в Taxonomy Browser, затем использовала этот идентификатор в поле Taxonomy в расширенном поиске по UniProtKB. На выходе я получила 18 записей в Swiss-Prot и 36421 — в TrEMBL. В рассчете на более-менее полную аннотацию, я выбрала одну из первых находок, лежащую в Swiss-Prot и имеющую код доступа P81445. К тому же, по моему мнению, этот белок имеет интересную функцию, восстанавлия нитрит до оксида азота (II) и, по-видимому, участвуя в процессе диссимиляционного восстановления нитрата (в ключевых словах упоминается ассимиляция нитрата, но в названии референсной статьи под RN [2] нитритредуктаза названа диссимиляционной).

Задание 2

Предполагаю, что рекомендуемое название белка Copper-containing nitrite reductase можно перевести как "медьсодержащая нитритредуктаза". Как было сказано выше, его функция состоит в восстановление нитрита до оксида азота (II). При этом в качестве донора электрона используется цитохром c. Эта нитритредуктаза функционирует в виде гомотримера и из кофакторов содержит ион меди (II) (связывается двумя субъединицами тримера и участвует в формировании активного центра), ион меди (I) (связан остатками одного мономера) и FAD (хотя в разделе FT сайты его связывания не обозначены). Мономер состоит из двух доменов: пластоцианинподобного 1 и пластоцианиподобного 2.

Судя по тому, что референсные статьи и записи во внешних базах данных, на которые имеются ссылки (нет ссылок на записи в ENA (EMBL) и GenBank), несут информацию только о самом белке, но не о его гене, последовательность медьсодержащей нитритредуктаза была определена с помощью рентгеноструктурного анализа и других экспериментальных методов, а ссылки на сведения о гене позднее добавлены не были, хотя полный геном Achromobacter xylosoxidans

Задание 3

Так как исследуемый белок является частью метаболического пути, представленного далеко не у всех бактерий, можно предположить, что он не является консервативным, мог утратиться в ходе эволюции и, возможно, быть приобретен путем горизонального переноса генов, играющего важную роль в эволюции геномов прокариот. Это соображения подтвержаются теми данными, что кластеры UniRef100 и UniRef90 формирует единственный белок Achromobacter xylosoxidans, а кластер UniRef50 включает в том числе медьсодержащие нитритредуктазы не слишком родственных данной бактерии (относится к Betaproteobacteria) бактерий из классов Aiphaproteobacteria и Gammaproteobacteria того же филлума Pseudomonadota и даже бактерий из филлума Gemmatimonadota.

Задание 4

  1. Запрос (ft_domain:"Plastocyanin-like 2") NOT (ft_domain:"Plastocyanin-like 1") был направлен на поиск редуктаз, содержащих пластоцианинподобный домен 1, но не пластоционинподобный домен 2. Ни одного белка найдено не было ни для этого запроса, ни для обратного, что говорит об их тесной функциональной связи и необходимости одного для функционирования другого.

  2. Поиск по запросу (cc_pathway:"dinitrogen from nitrate") AND (organism_id:85698) дал 11 результатов, однако, по-видимому, относящихся всего к двум белкам: исследуемой нитрит-редуктазе и редуктазе оксида азота (I). Таким образом, для Achromobacter xylosoxidans обнаружены свидельства существования двух ферментов пути восстановления нитрата до аммиака, a последовательности ферментов оставшихся двух стадий аннотированы не были, хотя мне кажется довольно странным предположение, что в данном случае их может не быть.

  3. Интересно, что я нашла в TrEMBL запись (O68601) о нитритредуктазе Achromobacter xylosoxidans с таким же названием, которая также была изучена на уровне белковой молекулы ((protein_name:"Copper-containing nitrite reductase") AND (organism_id:85698) AND (existence:1)). В этой записи последовательность белка на 30 аминокислот длинне, а ссылок на статьи и внешние базы данных содержится гораздо больше. Оказалось, что эта запись принадлежит к гораздо более многочисленным кластерам UniRef90 и UniRef50 (UniRef90_O68601 и UniRef50_P25006 соответственно) по сравнению с таковыми для записи в Swiss-Prot, что, возможно, говорит о том, что последовательность нитритредуктазы в ней указана точнее. На основании этого я могу предположить, что для выбранного мной белка данные из записи в курируемой базе данных могут быть более устаревшими и неточными, чем из записи в автоматической.

Задание 5

Только два факта для нитритредуктазы имеют ECO. Первый сообщает о локализации белка в периплазме и имеет код 0000250, обозначающий, что это сведение было получено из экспериментального исследования похожего белка. Однако, источник информации не указан, и, как я узнала из мануала, эта запись относится к тем, которые были созданы до введения системы классификации сведетельств, и коды ECO были позднее добавлены к ручной аннотации автоматически по принципу наиболее часто встречающегося типа свидельства в данной категории аннотации. Второе утверждение касается принадлежности белка к семейству "multicopper oxidases" и снабжено кодом 0000305, предполагающим, что оно было сформулировано куратором исходя из его/ее научных знаний или содержания какой-либо статьи, однако, опять же, ссылки на источник информации нет. Вывод: не стоит слепо доверять сведениям из аннотаций белков в UniProt, потому что не всегда ясно, откуда они вообще получены.