UniProt

Знакомство с UniProt

Цель практикума — познакомиться с устройством банка данных белков UniProt.

1. Общая информация о белке


Поиск общей информации состоял из двух частей. Первым шагом было изучение таблицы белка базы данных UniProt. Для этого на сайте UniProt в разделе Retrieve/ID mapping необходимо ввести PDB ID (1P9G) белка и в пункте "selection options" выбрать From PDB To UniProtKB.

После перехода на страницу записи к адресу можно добавить .txt для просмотра таблицы данных. Результаты представлены в таблице ниже:

EMBL AC нуклеотидной записи о какой-то причине отсутствует.
Характеристика Значение Поле
Раздел UniProt Swiss-Prot DT
UniProt ID EAP2_EUCUL DE
UniProt AC P83597 AC
EMBL AC нуклеотидной записи - DR
PDB ID 1P9G; 1P9Z
Длина в аминокислотных остатках 41 SQ
Молекулярная масса 4186 Да
Рекомендуемое название Antifungal peptide 2 DE

Белок состоит из одной цепи и содержит альфа-спираль, 310-спираль и антипараллельный бета-слой. При этом в белке много поддерживабщих структуру связей, а длина составляет всего 41 аминокислоты. Так, в белке присутствует пять дисульфидных мостов, прочно фиксирующих белковые структуры. Кроме того, в 310-спирали присутствуют нестандартные водородные связи, что должно быть описано в одной из предыдущих работ.

Такие структурные особенности могут быть обусловленны тем фактом, что белок репрезентативный, а его функция — защита растения Eucommia ulmoides (белок выделен из коры) от фитопатогенов, представленных некоторыми видами грибов, чем обусловлена его хитин-расщепляющая активность. Во внешней среде выгодны небольшой размер и усиленная стабилизация структуры.

2. Кластеры UniRef

Для нахождения кластеров можно воспользоваться представленным в пунке 1 способом, выбрав в "selection options" From UniProtKB To UniRef[X], где X соответствует 50, 90 или 100. Предварительно необходимо ввести найденный в таблице (см. пункт 1) идентификатор. В данном случае это EAP2_EUCUL или P83597.

ID Размер Название кластера
UniRef100_P83597 1 Antifungal peptide 2
UniRef90_P83597 2
UniRef50_P83597 2

3. Сеансы поиска Uniprot

Поиск по названиюю белка
Текст запроса Всего белков Reviewed (Swiss-Prot)
Без ограничений
name:"antifungal peptide 2" 2 1
Организм (species)
name:"antifungal peptide 2" taxonomy:"eucommia ulmoides" 1 1
Cемейства (familia)
name:"antifungal peptide 2" taxonomy:eucommiaceae 1 1
Oтдела (Magnoliopsida, no rank)
name:"antifungal peptide 2" taxonomy:magnoliopsida 2 1
Поиск гомеобоксов
Текст запроса Всего белков Reviewed (Swiss-Prot)
Без ограничений
name:homeobox 101867 1398
Fungi
name:homeobox taxonomy:fungi 6752 18
Vertebrata
name:homeobox taxonomy:vertebrata 55571 996
Поиск по трипсину
Текст запроса Всего белков Reviewed (Swiss-Prot)
Без ограничений
name:trypsin 29929 320
Без ингибиторов трипсина
name:trypsin NOT name:inhibitor 24960 104

4. История изменений записи UniProt

Примечательно, что первая загрузка состоялась ещё 27 июня 2003 года. С тех пор (до 11 декабря 2019 года) было загружено 76 вариантов, причём можно проследить изменение системы записи номеров за всё это время, начиная с 41.14 и заканчивая 2019_11 с промежуточным форматом формы 1.1/42.8. В PDB запись впервые появляется 1 июня 2004, обновляется намного реже, но нынешняя версия от 25 декабря 2019 года актуальнее.

5. Ключи таблицы локальных особенностей