Белок YP_001041787.1

Основные сведения о белке

Name: 2-dehydro-3-deoxyphosphooctonate aldolase
Название: 2-дегидро-3-дезоксифосфооктонат-альдолаза

Описание белка содержится в Таблице 1.
Ниже приведены ссылки на файлы последовательности белка и его гена:

Таблица 1. Информация о белке 2-дегидро-3-дезоксифосфооктонат-альдолаза из организма Rhodobacter sphaeroides ATCC (идентификатор белка в базе данных RefSeq YP_001041787)
Информация получена с со страниц геномного браузера сайта NCBI: http://www.ncbi.nlm.nih.gov/genome

Вид информацииКвалификатор в записи геномаЗначение
Локус гена в геноме/locus_tagRsph17029_4073
Имя гена/geneRsph17029_4073
Идентификатор гена в базе Gene /db_xrefGeneID:4894991
Начало гена в геноме11118
Конец гена в геноме11954
На какой цепи кодируется ген (прямая или обратная)complement
Длина гена (в парах нуклеотидов)837
Идентификатор белка в базе данных NCBI Protein/protein_idYP_001041787.1
Длина белка (в аминокислотных остатках)278

Дополнительные сведения о белке (блок 2 второго семестра)

Таблица 2. Записи белка 2-дегидро-3-дезоксифосфооктонат-альдолаза в базах данных Uniprot, RefSeq, и PDB

База данныхИдентификатор (ссылка)
UniprotAC: A3PS35; ID: A3PS35_RHOS1 (текст, web-страница)
Uniref50Uniref50_B9KXA3 (web-страница)
RefSeq proteinsYP_001041787.1 (текст, web-страница)
PDBТочного соответствия Uniprot Retrieve/ID mapping не находит, ближайший аналог: 3FS2

История изменений записи A3PS35 Uniprot

Версия 1 датирована 2007-04-03.
Последняя, 56 версия датирована 2015-03-11.

В новом описании:

  1. Добавлено 3 альтернативных имени с сылками на достоверность:
  2. Добавлено описание католитической активности, путей биосинтеза, расположение белка в клетке, и семейства белка, все со ссылками на достоверность:
  3. Добавлено 24 ссылки на другие базы данных:
  4. Также добавлено 7 ключевых слов:

Множество гомологичных белков Uniref50_B9KXA3

Множество состоит из 5 последовательностей кластера Uniref50_B9KXA3 (AC коды: B9KXA3, Q3HKN7, A3PS35, F3U4A2, L1K8F6) и родственного белка, который имеет 3D структуру 3FS2 в базе PDB (AC код: Q8YHF1) и является таким же ферментом но в другой бактерии.
Длина пяти последовательностей равна 277-278aa, и только длина опорной последовательности кластера (seed sequence), B9KXA3, равна 669aa.

Excel-таблица с атрибутами последовательностей множества белков: Uniref50_B9KXA3.xls.
Колонки "Features" и "Cross reference (PDB)" оказались пустыми для всех последовательностей кластера Uniref50_B9KXA3.
В колонку "Function [CC]" не попали данные ни из одной записи, тем не менее, в колонки "Catalytic activity" и "Pathway" была успешно извлечена информация из соответствующих записей комментариев (CC) всех шести последовательностей.
Существенных отличий в найденных атрибутах этих белков нет (кроме длины, см. выше).

Способ аннотации нестандартных аминокислот в записи Uniprot

Поиск в разделе Help сайта Uniprot по ключевому слову selenocysteine находит ссылку на статью Non-standard residue в которой приведены ссылки на примеры аннотации позиций селеноцистеина и пирролизина в белке.

Нестандартные аминокислоты обозначаются меткой NON_STD в таблице свойств (feature table, FT строки).
Например, в записи P24183 есть следующая строка:

FT   NON_STD     196    196       Selenocysteine.
    
Она указывает, что 196-я аминокислота белка - селеноцистеин.
В случаях, когда селеноцистеин одновременно является частью активного сайта белка, он аннотируется дважды: как нестандартный остаток и как активный сайт. Например, в записи P07203 это описано так:
FT   ACT_SITE     49     49
FT   SITE         49     49       Subject to oxidation and hydroselenide
FT                                loss to dehydroalanine. {ECO:0000250}.
FT   NON_STD      49     49       Selenocysteine.
    

Сравнение аннотаций записей белка в Uniprot и Refseq Proteins

Форматы записей Uniprot и RefSeq сильно оличаются, тем не менее, большая часть информации о белке присутствует в обоих файлах.
Файлы записей белка в формате Uniprot и RefSeq Proteins.

Примеры отличий в аннотациях:
  • В записи Uniprot приведены альтернативные имена белка:

    DE AltName: Full=3-deoxy-D-manno-octulosonic acid 8-phosphate synthase {ECO:0000256|HAMAP-Rule:MF_00056};
    DE AltName: Full=KDO-8-phosphate synthase {ECO:0000256|HAMAP-Rule:MF_00056};
    DE AltName: Full=Phospho-2-dehydro-3-deoxyoctonate aldolase {ECO:0000256|HAMAP-Rule:MF_00056};

  • В записи Uniprot указано семейство, к которому принадлежит белок, его обычное местоположение в клетке, путь биосинтеза в котором он участвует:

    CC -!- PATHWAY: Bacterial outer membrane biogenesis; lipopolysaccharide
    CC biosynthesis. {ECO:0000256|HAMAP-Rule:MF_00056,
    CC ECO:0000256|SAAS:SAAS00078549}.
    CC -!- PATHWAY: Carbohydrate biosynthesis; 3-deoxy-D-manno-octulosonate
    CC biosynthesis; 3-deoxy-D-manno-octulosonate from D-ribulose 5-
    CC phosphate: step 2/3. {ECO:0000256|HAMAP-Rule:MF_00056,
    CC ECO:0000256|SAAS:SAAS00078570}.
    CC -!- SUBCELLULAR LOCATION: Cytoplasm {ECO:0000256|HAMAP-Rule:MF_00056,
    CC ECO:0000256|SAAS:SAAS00078569}.
    CC -!- SIMILARITY: Belongs to the KdsA family. {ECO:0000256|HAMAP-
    CC Rule:MF_00056}.

  • В записи Uniprot указано больше ссылок на другие базы данных (RefSeq содержит только ссылки на InterPro и GeneID).
  • В записи RefSeq указана связь с координатами в нуклеотидной последовательности (Uniprot тоже ссылается на NC_009040, но без координат):

    CDS 1..278 /locus_tag="Rsph17029_4073" /coded_by="complement(NC_009040.1:11118..11954)"

  • В записи RefSeq есть ссылка на Bioproject:

    DBLINK BioProject: PRJNA58449

Ссылки:

  1. Страница YP_001041787 на сайте NCBI
  2. Страница A3PS35 на сайте Uniprot