Анализ информации о геноме белка бактерии Bradyrhizobium sp. CCGE-LA001 в базе данных Uniprot


Общая информация

C помощью сервиса "Retrieve/ID mapping" по идентификатору CDS (AMA60725.1) я нашел запись Uniprot с моим белком бактерии Bradyrhizobium sp. Анализируя данные Uniprot, я выяснил, что исследованный белок называется Copper-binding protein, его существование лишь предполагается (сгенерирована програмно и находится в базе данных TrEMBL). Вся информация таблицы была взята непосредственно из записи Uniprot этого белка.

Uniprot ID A0A0X8CP23_9BRAD
Uniprot AC A0A0X8CP23
Refseq ID WP_060737298.1; NZ_CP013949.1
PDB ID -
Длина (AA) 196
Молекулярная масса (MW) 21381
SubName (Full) Copper-binding protein {ECO:0000313|EMBL:AMA60725.1}

Описание кластеров Uniref

    • Uniref100 - утилита, объединяющая 100% идентичные последовательности или фрагменты из 11 и более остатков, являющиеся подпоследовательностями.

      ID кластера моего белка - UniRef100_A0A0X8CP23, он отвечает за кодировку двух белков организма Bradyrhizobium sp.: Bradyrhizobium sp. CCGE-LA001 (мой белок) и Bradyrhizobium sp. DOA1. Эта последовательность является точной копией последовательности моего белка и её достоверность существования так же не была подтверждена.

    • Uniref90 сотставлен из псоледовательностей, идентичных по крайней мере на 90% или перекрывающихся на 80% и более.

      ID кластера - UniRef90_Q89VB6, он содержит 45 последовательностей, длинной 196 АА и принадлежащих организмам из рода Bradyrhizobium.

    • UniRef50 составлен из последовательностей идентичных на 50%.

      ID кластера - UniRef50_Q89VB6, он содержит 174 последовательности, длина варьирует от 207 до 191 АА. Белки этого кластера встречаются в основном у групп Bradyrhizobium и Rhodopseudomonas palustris но есть и другие виды бактерий.

    Advanced search в Uniprot

    • Запрос: name:"copper binding protein" (поиск по названию белка).
      Результат запроса: 4274 последовательности из базы TrEMBL и 7 рецензированных из Swiss-Prot.

    • Запрос: name:"copper binding protein" AND organism:"Bradyrhizobium sp. CCGE-LA001 [1223566]" (поиск по названию белка среди данного организма).
      Результат запроса: 2 нерецензированные последовательности из базы TrEMBL.

    • Запрос: name:"copper binding protein" taxonomy:"Bradyrhizobiaceae [41294]" (поиск по названию белка среди семейства)
      Результат запроса: 101 последовательность из базы TrEMBL.

    • Запрос: name:"copper binding protein" taxonomy:"Proteobacteria [1224]" (поиск по названию белка среди данного отдела).
      Результат запроса: 2852 нерецензированные последовательности из базы TrEMBL и 2 рецензированных из Swiss-Prot.



    • Запрос: name:actin taxonomy:"Metazoa [33208]" (поиск белка актина среди таксона животные).
      Результат запроса: Найдено 18467 нерецензированных последовательностей из базы TrEMBL и 656 рецензированных из Swiss-Prot.

    • Запрос: name:trypsin (поиск белка трипсина).
      Результат запроса: Найдено 12931 нерецензированных последовательностей из базы TrEMBL и 310 рецензированных из Swiss-Prot.

      Запрос: name:trypsin name:inhibitor (поиск ингибиторов трипсина).
      Результат запроса: Найдено 2753 нерецензированных последовательностей из базы TrEMBL и 209 рецензированных из Swiss-Prot.


© Zenishin Alexey, 2016