Таблица 1:Информация о белке
UniProt ID | TRPE_SALTY |
UniProt AC |
P00898 |
RefSeq ID |
NP_460682.1;WP_001194371.1 |
PDB ID(full) |
1I1Q; X-ray; 1.90 A; A=1-520 |
PDB ID(sum) |
1I1Q |
Длина белка(в аминокислотных остатках) |
520 |
Молекулярная масса белка(в дальтонах) |
57088 |
Рекомендуемое UniProt название (полное) |
Anthranilate synthase component 1 |
Данный белок присутствует всего в обной записи PDB в составе бомолекулярного комплекса,состоящиго из двух цепей A(которой является данный белок) и В. полностью известна структура данного белка, ниже приведена последователность нуклеотидов, входящих в его состав:
MQTPKPTLEL LTCDAAYREN PTALFHQVCG DRPATLLLES ADIDSKDDLK SLLLVDSALR ITALGDTVTI QALSDNGASL LPLLDTALPA GVENDVLPAG RVLRFPPVSP LLDEDARLCS LSVFDAFRLL QGVVNIPTQE REAMFFGGLF AYDLVAGFEA LPHLEAGNNC PDYCFYLAET LMVIDHQKKS TRIQASLFTA SDREKQRLNA RLAYLSQQLT QPAPPLPVTP VPDMRCECNQ SDDAFGAVVR QLQKAIRAGE IFQVVPSRRF SLPCPSPLAA YYVLKKSNPS PYMFFMQDND FTLFGASPES SLKYDAASRQ IEIYPIAGTR PRGRRADGTL DRDLDSRIEL DMRTDHKELS EHLMLVDLAR NDLARICTPG SRYVADLTKV DRYSYVMHLV SRVVGELRHD LDALHAYRAC MNMGTLSGAP KVRAMQLIAD AEGQRRGSYG GAVGYFTAHG DLDTCIVIRS ALVENGIATV QAGAGIVLDS VPQSEADETR NKARAVLRAI ATAHHAQETF
Таблица 2:Информация о кластерах UniRef
Cluster ID | Количество белков в кластере | Дополнительная информация |
UniRef100_P00898 |
8 |
Все белки , включаемые в данный кластер, синезируются в организмах бактерий рода Salmonella. 7 из 8 белков имеют длину 520 а.о. , один имеет чуть меньшую длину, равную 498 а.о. |
UniRef90_P00898 |
430 |
Белки данного кластера синтезируются в организмах бактерий, принадлежащих к различным родам, в том числе роду Salmonella. |
UniRef50_P00898 |
2708 |
Длина белков, составляющих данный кластер сильно варьируется от 12 до 591 а.о.(при длине исследуемого белка равной 520 а.о. |
Таблица 3:Результаты сеансов поиска в UniProt
Текст запроса | Общее количество найденных белков | Количество белков Reviewed | Дополнительная информация |
name:"anthranilate synthase component 1" |
17543 |
67 |
Длина большинства найденных белков колеблется от 100 до 700 а.о., но есть и исключения, длина котрых более 2000 или менее 40 а.о. |
name:asi |
200 |
68 |
почти в 10 раз меньше белков, чем было найдено по полному названию. |
name:"anthranilate synthase component 1" organism:"salmonella typhimurium strain lt2 sgsc1412 atcc 700720" |
1 |
1 |
У данного организма известен только один подобный белок. |
name:asi taxonomy:enterobacteriaceae |
3 |
3 |
Всего три подобных белка среди организмов, относящихся к трем разным родам искомого семейства. |
name:asi taxonomy:proteobacteria |
29 |
29 |
Все найденные белки имеют очень схожую длину от 491 до 541 а.о.(кроме 1 белка, имеющего длину 150 а.о.). |
name:hemoglobin |
15227 |
948 |
Гемоглобин очень распространенный белок, в различных группах организмов сильно варьируется его длина(примерно от 10 до 3000 а.о.), а значит, вороятнее всего, и строение. |
name:hemoglobin taxonomy:metazoa |
3836 |
842 |
Большая часть изученных вараций молекул гемоглобина синтезирутся именно metazoa. |
name:hemoglobin taxonomy:ciliophora |
21 |
3 |
Гемоглобин инфузорий имеет длинц от 116 до 178 а.о. |
name:trypsin |
18951 |
311 |
Трипсин-белок,в органичме человека выпонающий ферментативную функцию. |
name:trypsin annotation:(type:function inhibitor) |
71 |
71 |
Ингибиторы трипсина составляют примерно четвертую часть сред и всех аннотированных белков, содржащих в названии слово трипсин. |
Было проведено сравнение записи о данном белке в UniProt с одной и двух записей о белке в RefSeq(NP_460682).
В целом, основная информация о белке,такая как его длинна и функции, не различается. Отличается то, какие данные
предоставлены более подробно на каждом из ресурсов. В записи RefSeq содержится максимально полная информация об исследованиях
и публикациях связанных с данным белком. В записи UniProt более подробно описано строение белка, приводится
сравнение структуры данного белка со структурами других белков, информация о которых содержится в базе данных UniProt.
Напримеp: в обех записях белок P00898 записан, как часть комплекса, который катализирует биосинтез антранилата, но в UniProt кроме того кратко описан
механизм данного синтеза.
Запись была создана 1988-11-01, почти 30 лет назад. Последнее изменение записи проведено 2018-02-28. В ходе многочисленных исправлений была, например, изменена первичная структура белка (длина осталась неизменной, но были заменены на верные некоторые аминокислоты,к примеру, в первоначальной записи белок начинался с фенилаланина, сейчас фенилаланин исправлен на изолейцин). В точности все изменения в последовательность аминокислот внесены 23 января 2002 года.
Альтернативные вариации указываются в поле FT в записи (при переводе записи текстовый формат). Обозначение альтернативной
записи занимает несколько строк,в первой строке
, где описывается альтернативная последовательность, следом за FT стоит VAR_SEQ, далее идут два числа-это начало
и конец соответсвенно участка, имеющего другую вариацию. Далее записана основная вариация и после знака " -> "
альтернативная вариация.
Например: для белка крысы с UniProtAC:P81278 строки в записи с указанием альтернативной вариации будут выглядеть так:
FT VAR_SEQ 33 83 TPDINPAWYTGRGIRPVGRFGRRRATPRDVTGLGQLSCLPL FT DGRTKFSQRG -> SECLTYGKQPLTSFHPFTSQMPP (in FT isoform 2). {ECO:0000305}. FT /FTId=VSP_004370.
Весенний семестр 2018