Нет, вы нам не подходите, ведь вы не оцелот,
Не Александр III, не лама и не крот,
Ведь в РСДРП не состоите. Кобыла и Трупоглазые Жабы, "Жизнь Моя Кабанья"
Обзор записи UniProt белка 5P2O
Вся информация, кроме отмеченной отдельно, взята из базы данных UniProt.
Информация о белке и хозяине, локальные особенности
Таблица 1. Информация о белке, взятая из записи UniProt
Рисунок 1. Ствол каштана, поражённый Cryphonectria parasitica[2]
Белок был получен из Cryphonectria parasitica, гриба, паразитирующего на каштанах и вызывающего у них серьёзное заболевание — рак коры, поражающий ствол и ветви деревьев(Рис. 1). Мицелий гриба распространяется в камбии, вызывая гипертрофию тканей. На пораженных деревьях отмирает кора, которая опадает, обнажая древесину.[1]
Эндотиапепсин — это фермент, гидролизующий белки со специфичностью, близкой к Пепсину A, т.е. предпочитает гидрофобные остатки в позициях P1 и P1’(остатками, между которыми проходит гидролиз).
Структура известна для всего белка, причём целиком она содержится только в 5HCT, в то время как остальные 531 PDB-файла содержат структуру белка уже после отщепления сигнальной и пропептидной последовательности.
Особенности из поля Feature Table
Активный центр фермента — Asp-124 и Ser-288.
Белок содержит сигнальную последовательность(1-20) и пропептидную последовательность(21-89), которые последовательно отщепляются в процессе активации. Весь остальной пептид(90-419) и есть рабочий фермент.
Имеется дисульфидный мостик между цистеинами 344 и 379.
Кластеры UniRef и сеансы поиска
В кластерах UniRef90 и 100 данный белок единственный представитель, а в UniRef50 он имеет статус типичного представителя(Representative), поскольку единственный имеет запись в Swiss-Prot.
В каждом кластере также содержится последовательность UniParc, которая идентична последовательности исследуемого белка, поэтому она не учитывается в подсчётах.
Всего у записи было 142 версии записи. Белок с самого начала находился в Swiss-Prot.
Самая первая запись датируется 01.10.1989 и уже тогда имела тот же самый AC, но ID тогда был CARP$ENDPA, потому что организм тогда назывался Endothia parasitica. В 1990 году на пятой версии записи ID поменялся на CARP$CRYPA в связи с переносом вида в род Cryphonectria, к которому она относится и сейчас. На восьмой версии ID принял современный вид CARP_CRYP.
За всё время .fasta файл обновился только один раз, на версии 11 в 1993 году, когда в .fasta файл добавили последоватльности пропептид и сигнальной последовательности, хотя ещё не было найдено, где заканчивается сигнальный пептид и начинается пропептид, а на версии 24 в 1995 году добавили и это.
Дисульфидный мостик добавили в запись в 2009 году на версии 82.
Feature Table
Поле FT устроенно довольно просто: в первой строке элемента выписывается тип особенности и номера остатков, имеющих отношение к ней. В последующих строках указываются примечания: в поле /note словами описывается суть особенности, а в поле /evidence указана статья, в которой эта особенность у данного белка впервые была описана. Ниже представлены примеры конкретных явлений.
Если у белка есть сигнальная последовательность, то в UniProt она записывается вот так:
FT SIGNAL 1..20
FT /evidence="ECO:0000255"
Остатки, входящие в активный центр записываются отдельно:
FT ACT_SITE 124
FT ACT_SITE 288
Дисульфидный мостик:
FT DISULFID 344..379
Нестандартные аминокислоты:
FT NON_STD 202
FT /note="Pyrrolysine"
FT NON_STD 367
FT /note="Selenocysteine"
Пирролизин взят из O30642, а селеноцистеин из P49908.
Альтернативный сплайсинг записывается следующим образом:
FT VAR_SEQ 301..312
FT /note="Missing (in isoform ZA and isoform ZB)"
FT /evidence="ECO:0000303|PubMed:7702574"
FT /id="VSP_000406"
FT VAR_SEQ 1105..1203
FT /note="RVVKVFHSFRDVIHKSKNQVSIHSFMTQPEYAADDEMSQSFLNQEESPSLAS
FT KSRITKRLSDAETVSQNNTNNNAVDCHQVQIVASHPNSPLQSQETPV -> EVINKFQT
FT GASFKGVLRRQNLSQQLDVKLVPSSYSEAVASVRTSPSTSSAVTPPPVGNQSGQSIS
FT (in isoform XA and isoform ZA)"
FT /evidence="ECO:0000303|PubMed:7702574"
FT /id="VSP_000407"
Трансмембранные белки делятся на три домена: внеклеточный, трансмембранный, внутриклеточный. В записи UniProt участки цепи, относящиеся к разным топологическим доменам записываются последовательно с указанием принадлежности к домену:
FT TOPO_DOM 1016..1025
FT /note="Extracellular" #Внеклеточный участок
FT /evidence="ECO:0000255"
FT TRANSMEM 1026..1047
FT /note="Helical" #Трансмембранная спираль
FT /evidence="ECO:0000255"
FT TOPO_DOM 1048..1203
FT /note="Cytoplasmic" #Внутриклеточный участок
FT /evidence="ECO:0000255"
Ботаника: Курс альгологии и микологии: Учебник / Под ред. Ю.Т. Дьякова. — М.: Изд-во МГУ, 2007. — 559 с. — (Классический университетский учебник). — ISBN 978-5-211-05336-6. c. 366-367