Знакомство с UniProt

В данном практикуме я нашел и проанализировал информацию о своем белке, описал его кластеры и провел несколько различных сеансов поиска в UniProt.

Получение информации о белке SALL_SALTO

Я нашел в UniProt белок по его GenBank AC, открыл его описание в текстовом формате и извлек необходимые мне данные. Полученная информация представлена в таблице 1.

Таблица 1. Основная информация о белке SALL_SALTO из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
SALL_SALTO A4X3Q0 WP_011904934.1 2Q6I;2Q6K;2Q6L;2Q6O 283 30148 Adenosyl-chloride synthase

Данный белок состоит из двух цепей. Самое высокое разрешение рентгеноструктурного анализа: 1.55Å. Структура белка представлена как альфа-спиралями, так и бета-тяжами, также имеются 3/10-спирали. В Uniprot дано описание функций и каталитической активности в присутствии бромида, хлорида, иодида, а также кинетических показателей этих реакций.

Поиск белка SALL_SALTO в UniRef

Белок был найден в базе UniRef по своему UniProt ID. Полученная информация представлена в таблице 2.

Таблица 2. Кластеры UniRef, содержащие белок SALL_SALTO.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_A4X3Q0 Adenosyl-chloride synthase 2
UniRef90 UniRef90_A4X3Q0 Adenosyl-chloride synthase 8
UniRef50 UniRef50_A4X3Q0 Adenosyl-chloride synthase 11

По размерам кластеров белка можно оценить, насколько его последовательность распространена среди различных организмов. Данный фермент идентичен на 90% восьми другим белкам, причем все организмы которым они свойственны, принадлежат роду Salinispora. На 50% идентичные белки имеются только у двух других представителей порядка Actinomycetales. Из этого можно сделать вывод, что данный белок является специфичным для данного рода. Данный белок Salinispora tropica является очень важным объектом для изучения, так как он участвует в образовании салиноспорамида А, который можно использовать в лечении рака.Также стоит отметить, что из 11 записей, приндалежащих кластеру UniRef50_A4X3Q0 (50%), только исследуемая запись находится в курируемой базе данных Swiss-Prot.

Сеансы поиска в UniProt

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.

Поиск аденозил-хлоридсинтазы

Поиск гистонов

Поиск трипсинов

Исследуемый белок специфичен для бактерий рода Salinispora, что подтвердилось вышеперечисленным анализом кластеров. Интересно, что для Eimeria tenella (одного из двух видов типа Apicomplexa, которые имеют записи в Swiss-Prot) было проведено секвенирование всего генома. Записей по трипсину намного больше, чем по его ингибиторам, однако количество записей Swiss-Prot у ингибиторов выше. Это объясняется тем, что последовательностей трипсина больше, чем последовательностей его ингибиторов, но больший научный интерес представляют именно ингибиторы.