Практикум 5. Знакомство с Uniprot.
В ходе практикума были приобретены навыки использования базы данных UniProt, необходимые для для эффективного получения информации о биомолекулах.
Основная информация о белке Q07982 из UniProt.
Для получения основных сведений о белке Q07982 из базы данных UniProt был изучен данный файл, полученный с помощью поиска в базе данных по идентификатору GenBank AAV89313.1. Полученные данные представлены в таблице 1.
UniProt ID | GFO_ZYMMO |
---|---|
UniProt AC | Q07982 |
Полное название белка | Glucose--fructose oxidoreductase |
Краткое название | GFOR |
Номер в классификации ферментов | 1.1.99.28 |
RefSeq ID | WP_011240581.1 |
PDB ID | 1EVJ; 1H6A; 1H6B; 1H6C; 1H6D; 1OFG; 1RYD; 1RYE |
Длина белка (а.о.) | 433 |
Молекулярная масса (Да) | 47190 |
С помощью анализа pdb-файлов белка было выяснено, что белок представлен единственной цепью, и что для него определена структура только с 53 по 433 остаток. Однако в UniProt файле каждая биомолеклула белка определена как цепь единого соединения, а также в файле указано, что некоторые структуры (1H6A, 1H6B, 1H6C, 1H6D) определены полностью, что противоречит данным их pdb-файлов. В расчёт не бралась структура 1EVJ, так как данный белок является укороченным мутантом, который использовался в данном исследовании.
Кластеры белка Q07982 в UniRef.
Данные о кластерах, содержащих белок Q07982, были получены поиском по базе данных UniRef в составе UniProt. Данные об ID, названиях и размерах кластеров приведены в таблице 2.
UniRef100 | UniRef90 | UniRef50 | |
---|---|---|---|
ID кластера | UniRef100_Q07982 | UniRef90_Q07982 | UniRef50_Q07982 |
Название кластера | Glucose--fructose oxidoreductase (100%) | Glucose--fructose oxidoreductase (90%) | Glucose--fructose oxidoreductase (50%) |
Размер кластера | 4 | 9 | 25 |
Для UniRef100_Q07982 было обнаружено 4 белка, все они принадлежат Zymomonas mobilis. Для UniRef90_Q07982 все 9 белков также принадлежат Zymomonas mobilis. Для UniRef50_Q07982 14 из 25 белков не принадлежат Zymomonas mobilis. 4 белка из этих 14 отличаются по принадлежности на уровне рода. Остальные 10 относятся к порядкам Caulobacterales, Rhodospirillales, Rhizobiales внутри класса Alphaproteobacteria.
Сеансы поиска в UniProt.
С помощью функции поиска в базе данных UniProt был проведён поиск информации о белковых соединениях. Результаты сеансов поиска приведены ниже.
Поиск глюкозо-фруктозооксидоредуктазы.
Поиск по названию белка.
Текст запроса: "name:"glucose fructose oxidoreductase""
Количество находок в Swiss-Prot: 9
Общее количество находок: 3106
Поиск по названию белка среди белков Zymomonas mobilis subsp. mobilis ZM4 = ATCC 31821.
Текст запроса: "name:"glucose fructose oxidoreductase" organism:"zymomonas mobilis subsp mobilis strain atcc 31821 zm4 cp4""
Количество находок в Swiss-Prot: 1
Общее количество находок: 2
Поиск по названию белка среди белков представителей семейства Sphingomonadaceae.
Текст запроса: "name:"glucose fructose oxidoreductase" taxonomy:sphingomonadaceae"
Количество находок в Swiss-Prot: 1
Общее количество находок: 152
Поиск по названию белка среди белков представителей отдела Proteobacteria.
Текст запроса: "name:"glucose fructose oxidoreductase" taxonomy:proteobacteria"
Количество находок в Swiss-Prot: 1
Общее количество находок: 987
Поиск гомеобоксов.
Поиск без ограничений по таксонам.
Текст запроса: "name:homeobox"
Количество находок в Swiss-Prot: 1396
Общее количество находок: 58127
Поиск среди белков представителей типа Arthropoda.
Текст запроса: "name:homeobox taxonomy:arthropoda"
Количество находок в Swiss-Prot: 57
Общее количество находок: 4951
Поиск среди белков представителей типа Ciliophora.
Текст запроса: "name:homeobox taxonomy:ciliophora"
Количество находок в Swiss-Prot: 0
Общее количество находок: 2
Поиск трипсинов.
Поиск по слову "trypsin".
Текст запроса: "name:trypsin"
Количество находок в Swiss-Prot: 312
Общее количество находок: 23018
Поиск трипсинов с исключением ингибиторов.
Текст запроса: "name:trypsin NOT name:inhibitor"
Количество находок в Swiss-Prot: 101
Общее количество находок: 18270
Сравнение записей RefSeq и UniProt глюкозо-фруктозооксидоредуктазы (AAV89313.1).
Для изучаемого белка была найдена единственная
запись RefSeq по идентификатору WP_011240581.1.
Файл UniProt несёт значительно больше информации о соединении, чем файл RefSeq.
В отличие от
записи UniProt, запись RefSeq содержит в себе информацию только об одном идентификаторе (здесь: WP_011240581.1). Также
различаются содержание разделов Features в RefSeq и FeatureTable в UniProt.
Можно сделать вывод, что формат UniProt лучше
подходит для изучения соединения, а формат RefSeq служит для поверхностного обзора основных сведений о белке или иной биомолекуле.
Ключи таблицы локальных особенностей.
Для рассмотрения ключей Feature Table файла UniProt будет приведён пример отображения нестандартных
аминокислотных остатков (например, селеноцистеина и пирролизина).
В разделе информации о аминокислотной последовательности
[SQ] в виде однобуквенного кода в файле UniProt селеноцистеин и пирролизин обозначаются соответственно U и
O. В разделе таблицы локальных особенностей [FT] нестандартные остатки указываются в подразделе
[NON_STD]. Примеры: для селеноцистеина (P24183)
и пирролизина (Q8TTA5).
Упоминание нестандартного остатка возможно в подразделе [ACT_SITE] (активный центр фермента) в разделе [FT],
если остаток является частью активного центра фермента (P07203).
Также нестандартные остатки упоминаются в разделе [KW] (ключевые слова).
Приведённая выше информация получена из раздела Help UniProt.