Работа с базой данных Uniprot

Базовая информация о белке

Белок ADX55361.1 бактерии Burkholderia sp. CCGE 1001, являющийся гликозил-трансферазой первого семейства.

В приведенной ниже таблице (табл.1) представленны идентефикаторы этого белка и его структурные и химические характеристики. Вот ссылка на запись в базе данных.

ПараметрЗначение
Uniprot IDE8YFS1_9BURK
Uniprot ACE8YFS1
Refseq IDWP_013588580.1
PDB IDОтсутствует
Длина (аминокислотных остатков)439
Молекулярная масса (дальтон)46729
Рекомендуемое названиеНет, так как запись еще не проверялась куратором

Таблица 1. Базовая информация о белке.

Существование данного белка предсказано на основе нахождения рамки считывания в геноме бактерии. В его структуре выделено два домена.

Кластеры, ассоциированные с этим белком

В приведенной ниже таблице (табл.2) представлена информация о включающих его кластерах.

Тип кластераID кластераИмя кластераКоличество белков
Uniprot 100UniRef100_E8YFS1Cluster: Glycosyl transferase group 11
Uniprot 90UniRef90_E8YFS1Cluster: Glycosyl transferase group 14
Uniprot 50UniRef50_E1T624Cluster: Glycosyl transferase group 126

Таблица 2. Информация о кластерах.

Поиск в базе данных Uniprot

В приведенной ниже таблице (табл.3) представлена информация о ходе поисковых работ в базе даных.

Смысл поискаТекст поискаКоличество результатов
Все белки с таким названиемname:"glycosyl transferase group 1"20744 не просмотренных куратором
Все белки из этого организма с таким названиемname:"glycosyl transferase group 1" AND organism:"Burkholderia sp. CCGE1001 [640510]"35 не просмотренных
Все белки с таким названием из семейства, включающего этот организмname:"glycosyl transferase group 1" taxonomy:"Burkholderiaceae [119060]"921 не просмотренных
Все белки с таким названием из отдела, включающего этот организмname:"glycosyl transferase group 1" taxonomy:"Burkholderiales [80840]"1274 не просмотренных
Цитохромname:cytochrome1610820 записи, из них 7548 просмотрено
Цитохром у сосудистых растенийname:cytochrome taxonomy:"Viridiplantae [33090]"40264 записи, из них 1483 просмотрено
Цитохром у членистоногихname:cytochrome taxonomy:"Arthropoda [6656]"841614 записи, из них 230 просмотрено
Трипсинname:trypsin13241 записи, из них 310 просмотрено
Ингибитор трипсинаname:trypsin name:inhibitor2962 записи, из них 209 просмотрено

Таблица 3. Поиск в базе данных.

Содержимое базы данных RefSeq

В этой базе данных мало содержимого по этому конкретному белку. Вообще, записи в Refseq уделяют много внимания доменам белка, структурным мотивам и активным сайтам.
Вот ссылка на запись, отвечающею этому белку в базе данных RefSeq.

История изменений этой записи.

Данная запись изменялась 27 раз в автоматическом режиме. Названия доменов неоднократно изменялись между двумя состояниями. Данные об изменениях записи взяты отсюда.

Отражение в Uniprot нестандарных белков.

В таблице 4 представленна форма записи в базе данных различных усложнений белка по данным из руководства пользователя. Это описывается только на строчке, начинающейся с буквосочетания 'FT'.

МодификацияЗапись
Отрезание первичного метионина
FT   INIT_MET      1      1       Removed.
Нестандартные остатки
FT   NON_STD     356    356       Pyrrolysine. {ECO:0000250}.
Посттрансляционная модификация
FT   MOD_RES     367    367       Sulfotyrosine. {ECO:0000250}.
Гликозилирование
FT   CARBOHYD    251    251       N-linked (GlcNAc...).

FT                                /FTId=CAR_000070.
Кроссшивки
FT   CROSSLNK     63     73       Lanthionine (Ser-Cys).
Дисульфидная связь
FT   DISULFID     23     84       {ECO:0000305}.
Варианты последовательности из-за альтернтивного синтеза
FT   VAR_SEQ     653    672       VATSNPGKCLSFTNSTFTFT -> ALVSHHCPVEAVRAVHP

FT                                TRL (in isoform 2).

FT                                /FTId=VSP_003786.

Таблица 4. Информация о структуре записей в базе данных.


© Бусыгин Сергей, 2017