Учебный сайт Лидии Гаркуль

Работа с UniProt

В данном практикуме с помощью базы данных UniProt была получена информация про амидогидролазу 2. PDB ID 4QRN, UniProt AC Q2GA79

1. Информация о белке.

UniProt AC данной амидогидролазы был найден через PDB ID с помощью формы "Retrieve/ID mapping".

Table. 1. Общая информация о белке.
Раздел UniProtKB UniProt ID UniProt AC EMBL AC нуклеотидной записи PDB ID Длина Молекулярная масса Submitted name
TrEMBL Q2GA79_NOVAD Q2GA79 CP000248 4INF; 4QRN; 4QS5; 4QS6; 4QTG; 351 аминокислотных остатков 39852 Да Amidohydrolase 2

Комментарии к таблице:

У данного белка было найдено пять записей о рентгеноструктурных анализах в PDB с разрешениями от 1.07 Å до 1.80 Å. Каждый анализ был произведён в одном и том же диапазоне 1-351. При этом количество цепей не совпадает: 4INF(1.48 Å), 4QRN(1.07 Å), 4QS5(1.80 Å) - четыре цепи; 4QS6(1.76 Å) и 4QTG(1.47 Å) по две цепи.

2. Кластеры UniRef.

Table. 2. Кластеры UniRef.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef50 UniRef50_Q2GA79 Cluster: Amidohydrolase 2 (50%) 177
UniRef90 UniRef90_Q2GA79 Cluster: Amidohydrolase 2 (90%) 11
UniRef100 UniRef100_Q2GA79 Cluster: Amidohydrolase 2 (100%) 2

В кластеры UniRef50 попадают записи, которые совпадают на 50 и более процентов. В кластере UniRef50_Q2GA79, куда попал данный белок, содержится 176 записей о белках, отличных от исследуемой молекулы. В кластеры UniRef90 попадают записи, которые совпадают на 90 и более процентов. В кластере UniRef90_Q2GA79, помимо записи рассматриваемой молекулы найдено еще 10 записей. Все белки из данного кластера были выделены из одного рода грам-отрицательных бактерий Novosphingobium. В кластеры из базы данных UniRef100 попадают записи, совпадающие на 100%. В UniRef100_Q2GA79 найдено всего две записи: рассматриваемая нами запись и запись из архива UniParc.

3. Сеансы поиска в UniProt.

Сеанс № 1

Поиск по названию данного белка.

Запрос: name:"amidohydrolase 2"

Всего записей: 4229

Записей из Swiss-Prot: 24

Сеанс № 2

Поиск по названию данного белка среди белков организма, указанного в записи.

Запрос: name:"amidohydrolase 2" organism:"novosphingobium aromaticivorans strain atcc 700278 dsm 12444 cip"

Всего записей: 6

Записей из Swiss-Prot: 0

Сеанс № 3

Поиск по названию данного белка среди белков организмов семейства Sphingomonadaceae.

Запрос: name:"amidohydrolase 2" taxonomy:sphingomonadaceae

Всего записей: 108

Записей из Swiss-Prot: 0

Сеанс № 4

Поиск по названию данного белка среди белков организмов отдела Proteobacteria.

Запрос: name:"amidohydrolase 2" taxonomy:proteobacteria

Всего записей: 1600

Записей из Swiss-Prot: 5

Сеанс № 5

Поиск по названию "гемоглобин".

Запрос: name:hemoglobin

Всего записей: 25826

Записей из Swiss-Prot: 950

Сеанс № 6

Поиск по названию "гемоглобин" среди организмов из подтипа Vertebrata.

Запрос: name:hemoglobin taxonomy:vertebrata

Всего записей: 3527

Записей из Swiss-Prot: 825

Сеанс № 7

Поиск по названию "гемоглобин" среди организмов из Metazoa.

Запрос: name:hemoglobin taxonomy:metazoa

Всего записей: 4,278

Записей из Swiss-Prot: 842

Сеанс № 8

Поиск названию "трипсин".

Запрос: name:trypsin

Всего записей: 29,530

Записей из Swiss-Prot: 320

Сеанс № 9

Посик по названию "трипсин", исключая все его ингибиторы.

Запрос: name:trypsin NOT name:inhibitor

Всего записей: 24,569

Записей из Swiss-Prot: 104

История изменений записи UniProt.

Первая запись об амидогидролазе 2 появилась в 2006 году. Последнее изменение было внесено 26 февраля 2020. В изначальной записи нет информации про PDB структуры белка, строки FT также отсутствуют. Первые данные про PDB структуру появляются в изменинии от 01.05.2013; строки FT появляются в изменении от 11.12.2013. Систематика бактерии, из которой был выделен белок, не поменялась.

Таблица локальных особенностей (Feature Table).

В строках FT (Feature table) описаны особенности в последовательности белка, которые были упомянуты в статьях или в других базах данных. Рассмотрим на примерах как в записи FT описываются различные интересные места в последовательностях.

Вариации в последовательностях.

FT VARIANT 237

FT /note="I -> L (in strain: B293, Z3524, Z3910, Z3915 and

FT Z3918)"

В первой строке стоит тип особенности (VARIANT) и указано расположение в цепи (237 аминокислотный остаток). После /note="" идет описание изменения - в данном случае замена изолейцина на лейцин (I -> L). Далее в скобках указано примечание - в каких штаммах происходит замена.

Посттрансляционная модификация

FT MOD_RES 58

FT /note="Methionine amide"

FT /evidence="ECO:0000250"

В первой строке также указывается тип особенности и ее расположение в структуре. В примечаниях /note="" указывают название видоизмененного остатка. После тега /evidence приводят ссылку на источник.