Учебный сайт Орлова Артёма

Практикум 5. Знакомство с Uniprot.

В ходе практикума были приобретены навыки использования базы данных UniProt, необходимые для для эффективного получения информации о биомолекулах.

Основная информация о белке Q07982 из UniProt.

Для получения основных сведений о белке Q07982 из базы данных UniProt был изучен данный файл, полученный с помощью поиска в базе данных по идентификатору GenBank AAV89313.1. Полученные данные представлены в таблице 1.

Таблица 1. Сведения о белке Q07982.
UniProt ID GFO_ZYMMO
UniProt AC Q07982
Полное название белка Glucose--fructose oxidoreductase
Краткое название GFOR
Номер в классификации ферментов 1.1.99.28
RefSeq ID WP_011240581.1
PDB ID 1EVJ; 1H6A; 1H6B; 1H6C; 1H6D; 1OFG; 1RYD; 1RYE
Длина белка (а.о.) 433
Молекулярная масса (Да) 47190

С помощью анализа pdb-файлов белка было выяснено, что белок представлен единственной цепью, и что для него определена структура только с 53 по 433 остаток. Однако в UniProt файле каждая биомолеклула белка определена как цепь единого соединения, а также в файле указано, что некоторые структуры (1H6A, 1H6B, 1H6C, 1H6D) определены полностью, что противоречит данным их pdb-файлов. В расчёт не бралась структура 1EVJ, так как данный белок является укороченным мутантом, который использовался в данном исследовании.

Кластеры белка Q07982 в UniRef.

Данные о кластерах, содержащих белок Q07982, были получены поиском по базе данных UniRef в составе UniProt. Данные об ID, названиях и размерах кластеров приведены в таблице 2.

Таблица 2. Кластеры UniRef, содержащие белок Q07982.
UniRef100 UniRef90 UniRef50
ID кластера UniRef100_Q07982 UniRef90_Q07982 UniRef50_Q07982
Название кластера Glucose--fructose oxidoreductase (100%) Glucose--fructose oxidoreductase (90%) Glucose--fructose oxidoreductase (50%)
Размер кластера 4 9 25

Для UniRef100_Q07982 было обнаружено 4 белка, все они принадлежат Zymomonas mobilis. Для UniRef90_Q07982 все 9 белков также принадлежат Zymomonas mobilis. Для UniRef50_Q07982 14 из 25 белков не принадлежат Zymomonas mobilis. 4 белка из этих 14 отличаются по принадлежности на уровне рода. Остальные 10 относятся к порядкам Caulobacterales, Rhodospirillales, Rhizobiales внутри класса Alphaproteobacteria.

Сеансы поиска в UniProt.

С помощью функции поиска в базе данных UniProt был проведён поиск информации о белковых соединениях. Результаты сеансов поиска приведены ниже.

Поиск глюкозо-фруктозооксидоредуктазы.

Поиск гомеобоксов.

Поиск трипсинов.

Сравнение записей RefSeq и UniProt глюкозо-фруктозооксидоредуктазы (AAV89313.1).

Для изучаемого белка была найдена единственная запись RefSeq по идентификатору WP_011240581.1. Файл UniProt несёт значительно больше информации о соединении, чем файл RefSeq.
В отличие от записи UniProt, запись RefSeq содержит в себе информацию только об одном идентификаторе (здесь: WP_011240581.1). Также различаются содержание разделов Features в RefSeq и FeatureTable в UniProt.
Можно сделать вывод, что формат UniProt лучше подходит для изучения соединения, а формат RefSeq служит для поверхностного обзора основных сведений о белке или иной биомолекуле.

Ключи таблицы локальных особенностей.

Для рассмотрения ключей Feature Table файла UniProt будет приведён пример отображения нестандартных аминокислотных остатков (например, селеноцистеина и пирролизина).
В разделе информации о аминокислотной последовательности [SQ] в виде однобуквенного кода в файле UniProt селеноцистеин и пирролизин обозначаются соответственно U и O. В разделе таблицы локальных особенностей [FT] нестандартные остатки указываются в подразделе [NON_STD]. Примеры: для селеноцистеина (P24183) и пирролизина (Q8TTA5).
Упоминание нестандартного остатка возможно в подразделе [ACT_SITE] (активный центр фермента) в разделе [FT], если остаток является частью активного центра фермента (P07203). Также нестандартные остатки упоминаются в разделе [KW] (ключевые слова).
Приведённая выше информация получена из раздела Help UniProt.