Знакомство с Uniprot

Основная цель практикума - ознакомиться с базой данных Uniprot, освоить основные методы работы с работой с ней.

Получение информации о белке LINB_SPHJU

В базе данных Uniprot была найдена информация о белке Haloalkane dehalogenase, который был получен из бактерии Sphingobium japonicum UT26. Полученная информация представлена в таблице 1:

Таблица 1. Основная информация о белке LINB_SPHJU из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
LINB_SPHJU D4Z2G1; P51698 WP_013040256.1 1CV2, 1D07, 1G42, 1G4H, 1G5F, 1IZ7, 1IZ8, 1K5P, 1K63, 1K6E, 1MJ5, 2BFN, 4WDQ, 4WDR, 5LKA 296 AA 33108 MW Haloalkane dehalogenase

Комментарий к таблице 1: Белок является мономером. Более подробную информацию о его структуре можно узнать в стетье "Purification and characterization of a haloalkane dehalogenase of a new substrate class from a gamma-hexachlorocyclohexane-degrading bacterium, Sphingomonas paucimobilis UT26." Белок был выделен из бактерии Sphingobium japonicum UT26, чей геном был впервые просеквенирован в 2010 году.

Поиск белка LINB_SPHJU в UniRef

По идентификатору белка был выполнен поиск в базе данных UniRef. Таким образом мы можем понять сколько существует белковых последовательностей, похожих друг на друга и на сколько процентов они совпадают. Всего есть три основных кластера схожести 100%, 90% и 50%. Также можно сделать вывод об изменении длин белковых последовательностей. Полученная информация представлена в таблице 2:

Таблица 2. Кластеры UniRef, содержащие белок LINB_SPHJU.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_D4Z2G1 Haloalkane dehalogenase 6
UniRef90 UniRef90_D4Z2G1 Haloalkane dehalogenase 53
UniRef50 UniRef50_D4Z2G1 Haloalkane dehalogenase 760

Количество белков в кластере (При переходе от UniRef100 к Uniref50) резко растет. Отсюда можем предположить, что последовательность белка подвержена изменениям и не является консервативной. При этом длина последовательности остается неизменной (равна 296, по данным UniRef).

Сеансы поиска в UniProt

Для более детального знакомства с базой данных UniProt были проведены следующие сеансы поиска:

Поиск Галогеналкан-дегалогеназы:

Поиск гистонов:

Поиск трипсинов:

Данный поиск позволяет оценить число белков различных классов в разных группах организмов. Можем сделать вывод, что данный белок втречается редко.