Знакомство с UniProt

В данном практикуме была найдена и проанализирована информация о белке Catalase-peroxidase 2, описаны его кластеры и проведены несколько различных сеансов поиска в UniProt.

Получение информации о белке KATG2_HALMA

Белок был найден в UniProt по его GenBank ID, его описание было открыто в текстовом формате и оттуда были извлечены необходимые данные. Полученная информация представлена в таблице 1.

Таблица 1. Основная информация о белке KATG2_HALMA из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса Рекомендуемое название
KATG2_HALMA O59651
Q5V2Y1
WP_049938864.1 1ITK
3UW8
3VLH
3VLI
3VLJ
3VLK
3VLL
3VLM
731 81384 Catalase-peroxidase 2

Структура данного белка представлена как альфа-спиралями, так и бета-тяжами. Самое высокое разрешение рентгеноструктурного анализа: 2.35Å.

Поиск белка KATG2_HALMA в UniRef

Для получения представленной в Таблице 2 информации в базе UniRef был совершен поиск по UniProt ID (KATG2_HALMA)

Таблица 2. Кластеры UniRef, содержащие белок KATG2_HALMA.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_O59651 Cluster: Catalase-peroxidase 2 1
UniRef90 UniRef90_O59651 Cluster: Catalase-peroxidase 2 21
UniRef50 UniRef50_P73911 Cluster: Catalase-peroxidase 16,333

По размерам кластеров белка можно оценить, насколько последовательность распространена среди различных организмов. Данный фермент идентичен на 90% двадцати одному другому белку, а на 50% идентичные белки имеются у шестнадцати других организмов.

Сеансы поиска в UniProt

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска

Поиск Каталазы-пероксидазы 2

Поиск по рекомендованному названию

Текст запроса: "name:"catalase-peroxidase 2""
Количество находок в Swiss-Prot: 29
Общее количество находок: 46

Поиск по короткому названию

Текст запроса: "name:"cp 2""
Количество находок в Swiss-Prot: 70
Общее количество находок: 1058

Поиск по короткому названию в организме

Текст запроса: "name:"cp 2" organism:"haloarcula marismortui""
Количество находок в Swiss-Prot: 1
Общее количество находок: 1

Поиск по короткому названию белка и одновременно по семейству

Текст запроса: "name:"cp 2" taxonomy:"Haloarculaceae""
Количество находок в Swiss-Prot: 1
Общее количество находок: 1

Поиск по короткому названию белка и одновременно по отделу

Текст запроса: "name:"cp 2" taxonomy:"Halobacteria""
Количество находок в Swiss-Prot: 1
Общее количество находок: 1

Поиск тубулинов

Поиск без ограничения организмов

Текст запроса: "name:"tubulin""
Количество находок в Swiss-Prot: 687
Общее количество находок: 70674

Поиск в таксоне Viridiplantae

Текст запроса: "name:"tubulin" taxonomy:"viridiplantae""
Количество находок в Swiss-Prot: 118
Общее количество находок: 5828

Поиск в таксоне Phaeophyceae

Текст запроса: "name:"tubulin" taxonomy:"phaeophyceae""
Количество находок в Swiss-Prot: 4
Общее количество находок: 28

Поиск трипсинов

Поиск по слову "трипсин"

Текст запроса: "name:"trypsin""
Количество находок в Swiss-Prot: 312
Общее количество находок: 23018

Поиск трипсинов, исключая их ингибиторы

Текст запроса: "name:"trypsin" NOT name:"inhibitor""
Количество находок в Swiss-Prot: 101
Общее количество находок: 18270

Знакомство с UniProt прошло успешно.