|
|
Uniref search (task 2) | ||||
Uniref | Uniref100 | Uniref90 | Uniref50 | |
Uniref ID | UniRef100_W8QL66 | UniRef90_W6ANB4 | UniRef50_Q59635 | |
Number of members | 1 | 35 | 1792 | |
Comments | UniRef90_W6ANB4 contains 34 catalases from Bacillus and one - from Streptococcus pneumoniae. UniRef50_Q59635 contains only organisms from Lactobacillales. |
Я сравнила запись о моем белке в Uniprot c записью RefSeq. На первый взгляд, запись Uniprot подробнее: там есть информация о протеоме, в который он входит, о кодирующей его нуклеотидной последовательности, о функциях белка, его кофакторах, а также информация о наличии его в разных базах данных и идентификаторы для них. Еще там есть ключевые слова, которые призваны облегчить поиск нужной последовательности в базе. В записи RefSeq этого нет, зато там можно найти информацию о регионах, входящих в последовательность и о сайтах связывания субстратов и кофакторов.
Я просмотрела историю изменений записи о моем белке в Uniprot. Запись появилась 2014-05-14 и с тех пор изменялась 18 раз. Самые первые изменения касались в основном функций белка, а более поздние - ключевых слов и баз данных . Последнее изменение было 2016-04-13.
В записи Uniprot могут быть представлены различные особенности данного белка. Например, нестандартные аминокислотные остатки (селеноцистеин или пирролизин), посттрансляционная модификация (фосфорилирование, гликозилирование, ...), альтернативный сплайсинг, дисульфидные связи, варианты последовательности. В записи они обычно указываются в поле FT. Например, посттрансляционная модификация (PTM) будет записана так:
FT MOD_RES 246 246 Phosphoserine; by CaMK4 and SIK1. FT {ECO:0000269|PubMed:10958686}.Первая колонка - название поля, вторая - особенность (в данном случае - модификация остатка), 2 следующие - начало и конец модификации в цепи, последняя - описание и ссылки. Еще модификация обычно описана в поле CC.