Основная информация
Информация была получена из базы данных Uniprot[1]. Ниже приведена таблица с некоторыми данными.
Таблица 1. Информация о белке |
Uniprot ID | Y1251_METJA |
Uniprot AC | Q58649 |
Refseq ID | WP_010870765.1 (предыдущий NC_000909.1) |
PDB ID | 3WVA, 3WVB, 3WVC |
Длина | 167 |
Молекулярная масса в дальтонах | 18946 |
Pекомендуемое Uniprot название | UPF0254 protein MJ1251 |
Дополнительная информация
- структура известна для всего белка, в pdb белок представлен двумя цепями;
- существование белка было подтвеждено экспериментально (Evidence at protein level);
- добавлен 6 июня 2003, последнее изменение 17 февраля 2017;
- версия последовательности от 1 ноября 1996;
- таксономия организма: Archaea; Euryarchaeota; Methanococci; Methanococcales; Methanocaldococcaceae; Methanocaldococcus; Methanococcus jannaschii;
- упоминался в статье Science (Science 273:1058-1073(1996));
Описание кластеров Uniref для белка
Первый и второй кластеры содержат только исследуемый белок, это говорит о том, что пока не были найдены гомологичные белки со 100 и 90 процентной идентичностью
(первый кластер опубликован 26 июня 2013, второй - 24 июня 2015). Третий кластер содержит 19 белков, в него входят белки, относящиеся к различным организмам,
таким как Methanotorris, Methanocaldococcus и Methanococcus. Все они относятся к метаногенным организмам, они продуцируют метан как побочный продукт метаболизма.
Таким образом, можно говорить о том, что данный белок является специфичным для метаногенных организмов. Ниже приведена таблица, содержащая информацию о кластерах.
Таблица 2. Информация о кластерах |
ID кластера | Размер |
UniRef100_Q58649 | 1 |
UniRef90_Q58649 | 1 |
UniRef50_Q58649 | 19 |
Результаты сеансов поиска в Uniprot
- Поиск по рекомендованному названию своего белка:
результат: 43; рецензировано 11
- Поиск по тому же названию среди белков своего организма:
запрос: name:upf0254 taxonomy:"Methanocaldococcus jannaschii [2190]"
результат: 1, рецензирован
- Поиск по тому же названию среди белков из организмов того же семейства (family):
запрос: name:upf0254 taxonomy:"Methanocaldococcaceae [196117]"
результат: 9, рецензированных: 1
- Поиск по тому же названию среди белков из организмов того же отдела (phylum):
запрос: name:upf0254 taxonomy:"Euryarchaeota [28890]";
результат: 43; рецензированных: 11;
- Поиск по названию гемоглобин:
запрос: name:hemoglobin; результат: 10 090, рецензированных: 944
запрос: name:hemoglobin taxonomy:"Arthropoda [6656]"; результат: 757, нет рецензированных;
запрос: name:hemoglobin taxonomy:"Vertebrata [7742]"; результат: 2566, рецензированных: 821;
запрос: name:hemoglobin taxonomy:"Metazoa [33208]"; результат: 3499, рецензированных: 838;
- Поиск по названию "трипсин":
результат: 13 241, рецензированных: 310
- Поиск по названию "ингибитор трипсина":
запрос: name:trypsin name:inhibitor
результат: 2 962, рецензированных: 209
Результаты дополнительных заданий
Сравнение записи в RefSeq и в Uniprot
Структура записи в RefSeq[2] и Uniprot примерно совпадают: и там, и там можно выделить основные части:
описание документа, аннотация последовательности и сама последовательность. Конкретно в записи Refseq присутствуют: идентификатор Refseq, описание (hypothetical
protein [Methanocaldococcus jannaschii]), название организма и его систематика, комментарий, особенности (из какого организма, его расположение) и последовательность
белка.
Стоит также отметить, что в RefSeq данный белок носит статус гипотетического белка, в то время как в Uniprot его существование было подтверждено
экспериментально. Некоторые отличия:
- В Refseq отсутствуют идентификаторы других баз данных;
- В Refseq отсутствует поле с авторами и публикациями;
- В Refseq отсутствует поле с особенностями вторичной структуры белка;
HISTORY
При нажатии кнопки HISTORY на странице белка выдается следующая информация:
Entry version 71 (15 Feb 2017)
Sequence version 1 (01 Nov 1996)
Значит, здесь используется первая версия последовательности от первого ноября 1996 года. Также данная версия страницы на Uniprot числится как 71 версия (последняя правка
15 февраля 2017).
Источники:
[1]: UniProt;
[2]: RefSeq: NCBI Reference Sequence Database
|