Учебный сайт
Владимира Ноздрина

Нет, вы нам не подходите, ведь вы не оцелот,
Не Александр III, не лама и не крот,
Ведь в РСДРП не состоите.
Кобыла и Трупоглазые Жабы, "Жизнь Моя Кабанья"

Обзор записи UniProt белка 5P2O

Вся информация, кроме отмеченной отдельно, взята из базы данных UniProt.

Информация о белке и хозяине, локальные особенности

Таблица 1. Информация о белке, взятая из записи UniProt
UniProtKB Swiss-Prot
UniProt ID CARP_CRYPA
UniProt AC P11838
EMBL X63351, X53997
PDB ID 1E5O, 1E80, 1E81, 1E82, 1EED, 1ENT, 1EPL, 1EPM, 1EPN, 1EPO, 1EPP, 1EPQ, 1EPR, 1ER8, 1GKT, 1GVT, 1GVU, 1GVV, 1GVW, 1GVX, 1OD1, 1OEW, 1OEX, 2ER0, 2ER6, Показать полностью...
Длина 419 аминокислот до активации и 330 после
Молекулярная
масса
43255 Да
Рекомендуемое название Endothiapepsin

Рисунок 1. Ствол каштана, поражённый Cryphonectria parasitica[2]
 Белок был получен из Cryphonectria parasitica, гриба, паразитирующего на каштанах и вызывающего у них серьёзное заболевание — рак коры, поражающий ствол и ветви деревьев(Рис. 1). Мицелий гриба распространяется в камбии, вызывая гипертрофию тканей. На пораженных деревьях отмирает кора, которая опадает, обнажая древесину.[1]
 Эндотиапепсин — это фермент, гидролизующий белки со специфичностью, близкой к Пепсину A, т.е. предпочитает гидрофобные остатки в позициях P1 и P1’(остатками, между которыми проходит гидролиз).
 Структура известна для всего белка, причём целиком она содержится только в 5HCT, в то время как остальные 531 PDB-файла содержат структуру белка уже после отщепления сигнальной и пропептидной последовательности.
Особенности из поля Feature Table
 Активный центр фермента — Asp-124 и Ser-288.
 Белок содержит сигнальную последовательность(1-20) и пропептидную последовательность(21-89), которые последовательно отщепляются в процессе активации. Весь остальной пептид(90-419) и есть рабочий фермент.
 Имеется дисульфидный мостик между цистеинами 344 и 379.

Кластеры UniRef и сеансы поиска

 В кластерах UniRef90 и 100 данный белок единственный представитель, а в UniRef50 он имеет статус типичного представителя(Representative), поскольку единственный имеет запись в Swiss-Prot.
 В каждом кластере также содержится последовательность UniParc, которая идентична последовательности исследуемого белка, поэтому она не учитывается в подсчётах.
Таблица 2. Описание кластеров UniRef
ID кластера Название кластера Размер кластера
UniRef100 UniRef100_P11838 Endothiapepsin 1
UniRef90 UniRef90_P11838 Endothiapepsin 1
UniRef50 UniRef50_P11838 Endothiapepsin 32
Таблица 3. Сводка по сеансам поиска.
Текст запроса Всего результатов Из них в Swiss-Prot
1 name:endothiapepsin 216 1
name:endothiapepsin organism:"cryphonectria parasitica" 1 1
name:endothiapepsin taxonomy:cryphonectriaceae 1 1
name:endothiapepsin taxonomy:ascomycota 215 1
2 name:homeobox 100882 1398
name:homeobox taxonomy:metazoa 74557 1142
name:homeobox taxonomy:arthropoda 9154 57
3 name:trypsin 29530 320
name:trypsin NOT name:inhibitor 24569 104

История записи UniProt

 Всего у записи было 142 версии записи. Белок с самого начала находился в Swiss-Prot.
 Самая первая запись датируется 01.10.1989 и уже тогда имела тот же самый AC, но ID тогда был CARP$ENDPA, потому что организм тогда назывался Endothia parasitica. В 1990 году на пятой версии записи ID поменялся на CARP$CRYPA в связи с переносом вида в род Cryphonectria, к которому она относится и сейчас. На восьмой версии ID принял современный вид CARP_CRYP.
 За всё время .fasta файл обновился только один раз, на версии 11 в 1993 году, когда в .fasta файл добавили последоватльности пропептид и сигнальной последовательности, хотя ещё не было найдено, где заканчивается сигнальный пептид и начинается пропептид, а на версии 24 в 1995 году добавили и это.
 Дисульфидный мостик добавили в запись в 2009 году на версии 82.

Feature Table

 Поле FT устроенно довольно просто: в первой строке элемента выписывается тип особенности и номера остатков, имеющих отношение к ней. В последующих строках указываются примечания: в поле /note словами описывается суть особенности, а в поле /evidence указана статья, в которой эта особенность у данного белка впервые была описана. Ниже представлены примеры конкретных явлений.
  1. Если у белка есть сигнальная последовательность, то в UniProt она записывается вот так:
    FT   SIGNAL          1..20
    FT                   /evidence="ECO:0000255"
  2. Остатки, входящие в активный центр записываются отдельно:
    FT   ACT_SITE        124
    FT   ACT_SITE        288
  3. Дисульфидный мостик:
    FT   DISULFID       344..379
  4. Нестандартные аминокислоты:
    FT   NON_STD         202
    FT                   /note="Pyrrolysine"
    FT   NON_STD         367
    FT                   /note="Selenocysteine"
    Пирролизин взят из O30642, а селеноцистеин из P49908.
  5. Альтернативный сплайсинг записывается следующим образом:
    FT   VAR_SEQ         301..312
    FT                   /note="Missing (in isoform ZA and isoform ZB)"
    FT                   /evidence="ECO:0000303|PubMed:7702574"
    FT                   /id="VSP_000406"
    FT   VAR_SEQ         1105..1203
    FT                   /note="RVVKVFHSFRDVIHKSKNQVSIHSFMTQPEYAADDEMSQSFLNQEESPSLAS
    FT                   KSRITKRLSDAETVSQNNTNNNAVDCHQVQIVASHPNSPLQSQETPV -> EVINKFQT
    FT                   GASFKGVLRRQNLSQQLDVKLVPSSYSEAVASVRTSPSTSSAVTPPPVGNQSGQSIS
    FT                   (in isoform XA and isoform ZA)"
    FT                   /evidence="ECO:0000303|PubMed:7702574"
    FT                   /id="VSP_000407"
    Взято из Q64542.
  6. При описании модифицированных остатков указывается либо присоединяемая молекула(1), либо название аминокислоты, получившейся в итоге(2, 3):
    1. Гликозилирование:
      FT   CARBOHYD        38
      FT                   /note="N-linked (GlcNAc...) asparagine"
      FT                   /evidence="ECO:0000255"
    2. Фосфорилирование:
      FT   MOD_RES         166
      FT                   /note="Phosphotyrosine" FT                   /evidence="ECO:0000250|UniProtKB:P33535"
    3. Гидроксилирование:
      FT   MOD_RES         2167
      FT                   /note="4-hydroxyproline"
      FT                   /evidence="ECO:0000269|PubMed:8051117"
    (1, 2) Взято из P42866, (3) из Q02388.
  7. Трансмембранные белки делятся на три домена: внеклеточный, трансмембранный, внутриклеточный. В записи UniProt участки цепи, относящиеся к разным топологическим доменам записываются последовательно с указанием принадлежности к домену:
    FT   TOPO_DOM        1016..1025
    FT                   /note="Extracellular" #Внеклеточный участок
    FT                   /evidence="ECO:0000255"
    FT   TRANSMEM        1026..1047
    FT                   /note="Helical" #Трансмембранная спираль
    FT                   /evidence="ECO:0000255"
    FT   TOPO_DOM        1048..1203
    FT                   /note="Cytoplasmic" #Внутриклеточный участок
    FT                   /evidence="ECO:0000255"
    Взято из P42866.
Источники
  1. Ботаника: Курс альгологии и микологии: Учебник / Под ред. Ю.Т. Дьякова. — М.: Изд-во МГУ, 2007. — 559 с. — (Классический университетский учебник). — ISBN 978-5-211-05336-6. c. 366-367
  2. Joseph OBrien, USDA Forest Service, Bugwood.org