Знакомство с UniProt
Цель практикума: знакомство с банком UniProt и работа с ним, описание белка D-psicose 3-epimerase.
Получение информации о белке DPES_CLOCE
С помощью базы данных UniProt была получена информация, приведенная в таблице 1.
UniProt ID | UniProt AC | RefSeq ID | PDB ID | Длина белка (а.о.) | Молекулярная масса (Да) | Рекомендуемое название |
---|---|---|---|---|---|---|
DPES_CLOCE | B8I944 | WP_015924461.1 | 3VNI; 3VNJ; 3VNK; 3VNL; 3VNM | 293 | 33034 | D-psicose 3-epimerase |
По функции этот белок является изомеразой. Каталитически активен в присутствии кобальта, марганца, которые белок связывает в субъединицу, а также может использовать, но в меньшей степени, и магний, железо, никель. Самое высокое разрешение рентгеновского метода-2.15 ангстрем, самое низкое-1.98.
Поиск белка DPES_CLOCE UniRef
В базе данных UniRef был произведен поиск аминокислотных последовательностей, а именно три кластера со степенью совпадения 100%, 90%, 50%.
Раздел UniRef | ID кластера | Название кластера | Размер кластера |
---|---|---|---|
UniRef100 | UniRef100_B8I944 | D-psicose 3-epimerase(100%) | 2 |
UniRef90 | UniRef90_B8I944 | D-psicose 3-epimerase(90%) | 4 |
UniRef50 | UniRef50_A9CH28 | D-psicose 3-epimerase(50%) | 208 |
В кластере UniRef50 (его размер больше UniRef100 и UniRef90: 208) находятся бактерии, относящиеся к разным родам (Agrobacterium fabrum, Rhizobium radiobacter и другие). Это значит, что данный белок является специфичным для этих бактерий.
Сеансы поиска в UniProt
Для знакомства с синтаксисом запросов в UniProt были проведены следующие сеансы поиска.
Поиск белка DPES_CLOCE
-
Поиск в UniProt по рекомендованному названию белка
Текст запроса: name:"d-psicose 3-epimerase"
Количество находок в Swiss-Prot: 3
Общее количество находок: 51
-
Поиск по тому же названию среди белков своего организма.
Текст запроса: name:" d-psicose 3-epimerase " and taxonomy:"clostridium cellulolyticum"
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
-
Поиск по рекомендованному названию среди белков из организмов отдела
Текст запроса: name:" d-psicose 3-epimerase " and taxonomy:"clostridia"
Количество находок в Swiss-Prot: 2
Общее количество находок: 2
-
Поиск по рекомендованному названию среди белков из организмов семейства
Текст запроса: name:"d-psicose 3-epimerase" and taxonomy:"hungateiclostridiaceae"
Количество находок в Swiss-Prot: 1
Общее количество находок: 1
Поиск гомеобокса
-
Поиск гомеобоксов без ограничений на организмы
Текст запроса: name:"homeobox"
Количество находок в Swiss-Prot: 1 396
Общее количество находок: 49 124
-
Поиск гомеобоксов у Позвоночных
Текст запроса: name:"homeobox" and taxonomy:"metazoa"
Количество находок в Swiss-Prot:1 140
Общее количество находок:37 952
-
Поиск гомеобоксов у Инфузорий
Текст запроса: name:"homeobox" and taxonomy:"Ciliophora"
Количество находок в Swiss-Prot: 2
Общее количество находок:2
-
Поиск гомеобоксов у Грибов
Текст запроса: name:"homeobox" and taxonomy:"Fungi"
Количество находок в Swiss-Prot:18
Общее количество находок:1 608
Поиск трипсинов
-
Поиск по слову "трипсин"
Текст запроса: name: "trypsin"
Количество находок в Swiss-Prot: 312
Общее количество находок: 23 483
-
Поиск трипсинов, исключая их ингибиторы
Текст запроса: name:"trypsin" NOT name: "inhibitor"
Количество находок в Swiss-Prot:95
Общее количество находок: 19 065
По результатам анализа можно сделать небольшой вывод о том, что мой белок недостаточно хорошо изучен. Гомеобокс — последовательность ДНК, обнаруженная в генах, вовлечённых в регуляцию развития у животных, грибов и растений. Эти гены кодируют факторы транскрипции, которые, как правило, переключают каскады других генов. Наиболее изученными и наиболее консервативными из них являются Hox-гены, которые контролируют сегментацию во время развития.