Uniprot, Refseq Proteins: структура записи

На этой странице представлена информация о структуре записи в различных базах данных: Uniprot, Uniref50, RefSeq Proteins.
Исследование велось по белку тимидилат синтазы (thymidylate synthase thyX) из организма Deinococcus maricopensis DSM 21211

Идентефикаторы белка
UniprotKBE8UC26, E8UC26_DEIML
Uniref50UniRef50_Q1IWR3
RefSeq ProteinsADV68687.1
PDB2CFA

История изменений в записи Uniprot

Было проведено сравнение первой записи о белке и последней на данный момент - 22 версией.
Дата первой записи: 2011-04-05
Дата последней записи: 2015-03-11
По сравнению с первой версией были сделаны значительные изменения. Идентефикатор белка E8UC26_9DEIO был заменён на E8UC26_DEIML. Эта поправка была внесена ещё во второй версии. Сейчас актуален второй идентефикатор.
- ID   E8UC26_9DEIO            Unreviewed;       251 AA.
		
+ ID   E8UC26_DEIML            Unreviewed;       251 AA.
		
Также изменился статус белка с Прогнозируемый (Predicted) на Предполагаемый по гомологии (Inferred from homology), что говорит о более тщательном изучении thyX.
- PE   4: Predicted;
		
+ PE   3: Inferred from homology;
		

В целом гораздо больше данных было добавлено, нежели исправлено. Так появился полностью новый раздел CC, содеращий инормацию о функциях thyX, каталитической активности, её кофакторах, структуре и систематике.
+ CC   -!- FUNCTION: Catalyzes the formation of dTMP and tetrahydrofolate from dUMP
+ CC       and methylenetetrahydrofolate. {ECO:0000256|HAMAP-Rule:MF_01408}.
+ CC   -!- CATALYTIC ACTIVITY: 5,10-methylenetetrahydrofolate + dUMP + NADPH = dTMP
+ CC       + tetrahydrofolate + NADP(+). {ECO:0000256|HAMAP-Rule:MF_01408}.
+ CC   -!- COFACTOR:
+ CC       Name=FAD; Xref=ChEBI:CHEBI:57692;
+ CC         Evidence={ECO:0000256|HAMAP-Rule:MF_01408};
+ CC   Note=Binds 1 FAD per subunit. {ECO:0000256|HAMAP-Rule:MF_01408};
+ CC   -!- SUBUNIT: Homotetramer. {ECO:0000256|HAMAP-Rule:MF_01408}.
+ CC   -!- SIMILARITY: Belongs to the thymidylate synthase ThyX family.
+ CC       {ECO:0000256|HAMAP-Rule:MF_01408}.
+ CC   -!- SIMILARITY: Contains 1 thyX (flavin-dependent thymidylate synthase)
+ CC       domain. {ECO:0000256|HAMAP-Rule:MF_01408}.

Сравнение записей Uniprot гомологичных белков из разных организмов

»Сравнительная таблица гомологов thyX
Сравнение велось по тому же белку тимидилат синтазы, однако теперь у таких организмов рода Deinococcus, как Deinococcus gobiensis, Deinococcus peraridilitoris, Deinococcus maricopensis и Deinococcus geothermalis.
Белки тимидилат синтазы из этих организмов не сильно отличаются по длине - от 211 до 258 аминокислот. Все они были определены по гомологии. Что примечательно, во всех организмах белок выполняет одинаковую функцию. Это говорит о том, что участки активного центра в них имеют одинаковое пространственное расположение.

Полиморфизм в Uniprot

Комментарии для единственного варианта последовательности обычно находятся в "Природном варианте" (Natural variant). Подраздел "Полиморфизм" (Polymorphism) используется только тогда, когда информация не может быть размещена в одном "Природном варианте". То есть существует несколько вариантов последовательности белка. Пример белка, обладающего полиморфизмом - Histatin-3. В текстовом формате его записи указано, в каких частях последовательности встречается это явление (поле FT):
FT   VARIANT      41     41       R -> Q (in histatin-3-2; loss of the
FT                                proteolytic cleavage site;
FT                                dbSNP:rs1136511).
FT                                {ECO:0000269|PubMed:7951254}.
FT                                /FTId=VAR_005288.
FT   VARIANT      47     51       Missing (in histatin-3-2;
FT                                dbSNP:rs17147990).
FT                                {ECO:0000269|PubMed:7951254}.
FT                                /FTId=VAR_005289.

Также указание на полиморфизм присутствует в ключевых словах (поле KW):
KW   Direct protein sequencing; Fungicide; Metal-binding; Polymorphism;

Различия записей в Uniprot и RefSeq Proteins

»Запись Uniprot
»Запись RefSeq Proteins
В целом, можно сказать, что Uniprot отличается интуитивной понятностью и содержит достаточно полную информацию о белке. Также в этой базе данных есть подразделы, отсутствующие в Refseq Proteins. Например - Имена и Таксономия (Names & Taxonomy)(Рис.1).
Рис.1

С другой стороны, подача информации в Refseq Proteins отличается строгостью и компактностью. Единственный специфический раздел, который мне удалось найти, это ссылки на программы и команды, с помощью которых можно получить дополнительную информацию о белке (Рис.2). Хотя он относится скорее к интерфейсу NCBI. В самом Refseq не нашлось разделов, которых нет в Uniprot.
Рис.2

«Назад
Дальше»

© Колупаева А.Л. 2014