Информация о белке в UniProt (UniProt AC белка: P00898)

Таблица 1:Информация о белке

UniProt ID TRPE_SALTY

UniProt AC

P00898

RefSeq ID

NP_460682.1;WP_001194371.1

PDB ID(full)

1I1Q; X-ray; 1.90 A; A=1-520

PDB ID(sum)

1I1Q

Длина белка(в аминокислотных остатках)

520

Молекулярная масса белка(в дальтонах)

57088

Рекомендуемое UniProt название (полное)

Anthranilate synthase component 1

Данный белок присутствует всего в обной записи PDB в составе бомолекулярного комплекса,состоящиго из двух цепей A(которой является данный белок) и В. полностью известна структура данного белка, ниже приведена последователность нуклеотидов, входящих в его состав:

MQTPKPTLEL LTCDAAYREN PTALFHQVCG DRPATLLLES ADIDSKDDLK SLLLVDSALR
ITALGDTVTI QALSDNGASL LPLLDTALPA GVENDVLPAG RVLRFPPVSP LLDEDARLCS
LSVFDAFRLL QGVVNIPTQE REAMFFGGLF AYDLVAGFEA LPHLEAGNNC PDYCFYLAET
LMVIDHQKKS TRIQASLFTA SDREKQRLNA RLAYLSQQLT QPAPPLPVTP VPDMRCECNQ
SDDAFGAVVR QLQKAIRAGE IFQVVPSRRF SLPCPSPLAA YYVLKKSNPS PYMFFMQDND
FTLFGASPES SLKYDAASRQ IEIYPIAGTR PRGRRADGTL DRDLDSRIEL DMRTDHKELS
EHLMLVDLAR NDLARICTPG SRYVADLTKV DRYSYVMHLV SRVVGELRHD LDALHAYRAC
MNMGTLSGAP KVRAMQLIAD AEGQRRGSYG GAVGYFTAHG DLDTCIVIRS ALVENGIATV
QAGAGIVLDS VPQSEADETR NKARAVLRAI ATAHHAQETF

Описание кластеров UniRef

Таблица 2:Информация о кластерах UniRef

Cluster ID Количество белков в кластере Дополнительная информация

UniRef100_P00898

8

Все белки , включаемые в данный кластер, синезируются в организмах бактерий рода Salmonella. 7 из 8 белков имеют длину 520 а.о. , один имеет чуть меньшую длину, равную 498 а.о.

UniRef90_P00898

430

Белки данного кластера синтезируются в организмах бактерий, принадлежащих к различным родам, в том числе роду Salmonella.

UniRef50_P00898

2708

Длина белков, составляющих данный кластер сильно варьируется от 12 до 591 а.о.(при длине исследуемого белка равной 520 а.о.

Результаты сеансов поиска в UniProt

Таблица 3:Результаты сеансов поиска в UniProt

Текст запроса Общее количество найденных белков Количество белков Reviewed Дополнительная информация

name:"anthranilate synthase component 1"

17543

67

Длина большинства найденных белков колеблется от 100 до 700 а.о., но есть и исключения, длина котрых более 2000 или менее 40 а.о.

name:asi

200

68

почти в 10 раз меньше белков, чем было найдено по полному названию.

name:"anthranilate synthase component 1" organism:"salmonella typhimurium strain lt2 sgsc1412 atcc 700720"

1

1

У данного организма известен только один подобный белок.

name:asi taxonomy:enterobacteriaceae

3

3

Всего три подобных белка среди организмов, относящихся к трем разным родам искомого семейства.

name:asi taxonomy:proteobacteria

29

29

Все найденные белки имеют очень схожую длину от 491 до 541 а.о.(кроме 1 белка, имеющего длину 150 а.о.).

name:hemoglobin

15227

948

Гемоглобин очень распространенный белок, в различных группах организмов сильно варьируется его длина(примерно от 10 до 3000 а.о.), а значит, вороятнее всего, и строение.

name:hemoglobin taxonomy:metazoa

3836

842

Большая часть изученных вараций молекул гемоглобина синтезирутся именно metazoa.

name:hemoglobin taxonomy:ciliophora

21

3

Гемоглобин инфузорий имеет длинц от 116 до 178 а.о.

name:trypsin

18951

311

Трипсин-белок,в органичме человека выпонающий ферментативную функцию.

name:trypsin annotation:(type:function inhibitor)

71

71

Ингибиторы трипсина составляют примерно четвертую часть сред и всех аннотированных белков, содржащих в названии слово трипсин.

Сравнение записей в UniProt и RefSeq

Было проведено сравнение записи о данном белке в UniProt с одной и двух записей о белке в RefSeq(NP_460682). В целом, основная информация о белке,такая как его длинна и функции, не различается. Отличается то, какие данные предоставлены более подробно на каждом из ресурсов. В записи RefSeq содержится максимально полная информация об исследованиях и публикациях связанных с данным белком. В записи UniProt более подробно описано строение белка, приводится сравнение структуры данного белка со структурами других белков, информация о которых содержится в базе данных UniProt.
Напримеp: в обех записях белок P00898 записан, как часть комплекса, который катализирует биосинтез антранилата, но в UniProt кроме того кратко описан механизм данного синтеза.

История измений записи P00898

Запись была создана 1988-11-01, почти 30 лет назад. Последнее изменение записи проведено 2018-02-28. В ходе многочисленных исправлений была, например, изменена первичная структура белка (длина осталась неизменной, но были заменены на верные некоторые аминокислоты,к примеру, в первоначальной записи белок начинался с фенилаланина, сейчас фенилаланин исправлен на изолейцин). В точности все изменения в последовательность аминокислот внесены 23 января 2002 года.

Обозначение альтернативных вариантов последовательности в UniProt

Альтернативные вариации указываются в поле FT в записи (при переводе записи текстовый формат). Обозначение альтернативной записи занимает несколько строк,в первой строке , где описывается альтернативная последовательность, следом за FT стоит VAR_SEQ, далее идут два числа-это начало и конец соответсвенно участка, имеющего другую вариацию. Далее записана основная вариация и после знака " -> " альтернативная вариация.
Например: для белка крысы с UniProtAC:P81278 строки в записи с указанием альтернативной вариации будут выглядеть так:

FT   VAR_SEQ      33     83       TPDINPAWYTGRGIRPVGRFGRRRATPRDVTGLGQLSCLPL
FT                                DGRTKFSQRG -> SECLTYGKQPLTSFHPFTSQMPP (in
FT                                isoform 2). {ECO:0000305}.
FT                                /FTId=VSP_004370.

Весенний семестр 2018


© Болихова Анастасия 2018