Знакомство с UniProt

Цель практикума: знакомство с банком UniProt и работа с ним, описание белка D-psicose 3-epimerase.

Получение информации о белке DPES_CLOCE

С помощью базы данных UniProt была получена информация, приведенная в таблице 1.

Таблица 1. Основная информация о белке DPES_CLOCE.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
DPES_CLOCE B8I944 WP_015924461.1 3VNI; 3VNJ; 3VNK; 3VNL; 3VNM 293 33034 D-psicose 3-epimerase

По функции этот белок является изомеразой. Каталитически активен в присутствии кобальта, марганца, которые белок связывает в субъединицу, а также может использовать, но в меньшей степени, и магний, железо, никель. Самое высокое разрешение рентгеновского метода-2.15 ангстрем, самое низкое-1.98.

Поиск белка DPES_CLOCE UniRef

В базе данных UniRef был произведен поиск аминокислотных последовательностей, а именно три кластера со степенью совпадения 100%, 90%, 50%.

Таблица 2. Кластеры UniRef, содержащие белок DPES_CLOCE.
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_B8I944 D-psicose 3-epimerase(100%) 2
UniRef90 UniRef90_B8I944 D-psicose 3-epimerase(90%) 4
UniRef50 UniRef50_A9CH28 D-psicose 3-epimerase(50%) 208

В кластере UniRef50 (его размер больше UniRef100 и UniRef90: 208) находятся бактерии, относящиеся к разным родам (Agrobacterium fabrum, Rhizobium radiobacter и другие). Это значит, что данный белок является специфичным для этих бактерий.

Сеансы поиска в UniProt

Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.

Поиск белка DPES_CLOCE

  • Поиск в UniProt по рекомендованному названию белка

    Текст запроса: name:"d-psicose 3-epimerase"
    Количество находок в Swiss-Prot: 3
    Общее количество находок: 51

  • Поиск по тому же названию среди белков своего организма.

    Текст запроса: name:" d-psicose 3-epimerase " and taxonomy:"clostridium cellulolyticum"
    Количество находок в Swiss-Prot: 1
    Общее количество находок: 1

  • Поиск по рекомендованному названию среди белков из организмов отдела

    Текст запроса: name:" d-psicose 3-epimerase " and taxonomy:"clostridia"
    Количество находок в Swiss-Prot: 2
    Общее количество находок: 2

  • Поиск по рекомендованному названию среди белков из организмов семейства

    Текст запроса: name:"d-psicose 3-epimerase" and taxonomy:"hungateiclostridiaceae"
    Количество находок в Swiss-Prot: 1
    Общее количество находок: 1

Поиск гомеобокса

  • Поиск гомеобоксов без ограничений на организмы

    Текст запроса: name:"homeobox"
    Количество находок в Swiss-Prot: 1 396
    Общее количество находок: 49 124

  • Поиск гомеобоксов у Позвоночных

    Текст запроса: name:"homeobox" and taxonomy:"metazoa"
    Количество находок в Swiss-Prot:1 140
    Общее количество находок:37 952

  • Поиск гомеобоксов у Инфузорий

    Текст запроса: name:"homeobox" and taxonomy:"Ciliophora"
    Количество находок в Swiss-Prot: 2
    Общее количество находок:2

  • Поиск гомеобоксов у Грибов

    Текст запроса: name:"homeobox" and taxonomy:"Fungi"
    Количество находок в Swiss-Prot:18
    Общее количество находок:1 608

Поиск трипсинов

  • Поиск по слову "трипсин"

    Текст запроса: name: "trypsin"
    Количество находок в Swiss-Prot: 312
    Общее количество находок: 23 483

  • Поиск трипсинов, исключая их ингибиторы

    Текст запроса: name:"trypsin" NOT name: "inhibitor"
    Количество находок в Swiss-Prot:95
    Общее количество находок: 19 065

По результатам анализа можно сделать небольшой вывод о том, что мой белок недостаточно хорошо изучен. Гомеобокс — последовательность ДНК, обнаруженная в генах, вовлечённых в регуляцию развития у животных, грибов и растений. Эти гены кодируют факторы транскрипции, которые, как правило, переключают каскады других генов. Наиболее изученными и наиболее консервативными из них являются Hox-гены, которые контролируют сегментацию во время развития.