Uniprot и Refseq Protein

Таблица 1. Общая информация о белке с RefSeq ID - YP_005889234.1

Параметр Значение
Uniprot ID Q5F9M9_NEIG1
Uniprot AC Q5F9M9
Refseq ID WP_003687776.1, YP_207520.1
PDB ID 4RCT, 4RD5, 4RDM
Длина 345 AA
Молекулярная масса 39837 MW
Рекомендуемое Unirpot название Restriction endonuclease NgoFVII

Комментарии к таблице: В записях PDB структура представлена 2 цепями. Статус - Unreviewed.

Для получения данных я воспользовалась сайтом Uniprot (PDB ID - воспользовалась для поиска).

Таблица 2. Описание кластеров

Идентификатор кластера Количество белков Аспекты, заслуживающие внимание
Uniref50_Q5F9M9 22 Две трети видов( 15 из 22 представленных), что имеют этот кластер, относятся к одному роду.
Uniref90_Q5F9M9 14 Пятая часть организмов принадлежит к другому роду, а из оставшихся - все, за исключением одного организма, относятся к одному виду.
Uniref100_Q5F9M9 4 Все организмы принадлежат к одной группе.

Таблица 3. Результаты сеансов поиска в Unirpot

Текст запроса Количество белков Белки из раздела Reviewed
name:restriction endonuclease ngofvii 142 1
name:restriction endonuclease ngofvii taxonomy:neisseria 8 1
name:restriction endonuclease ngofvii taxonomy:proteobacteria 45 1
name:actin 45955 1121
name:actin taxonomy:metazoa 16598 642
name:actin taxonomy:vertebrata 8246 491
name:trypsin 11134 301
name:trypsin name:inhibitor 2791 203

Как мы можем заметить, поиски по рекомендованному названию моего белка, семейству и отделу, к которым принадлежит организм с моим белком, показали наличие всего одного белка из раздела Reviewed. Поиск "actin" выдает примерно 2.4% белков из раздела Reviewed от всех найденных белков. Также, данный поиск выдает наибольшее число найденных белков из всех проведенных мной поисков. Группа "Metazoa" имеет 3.9% Review белков, а "Vertebrata" - 6%. Последние два примера иллюстрируют, что нам необходимо конкретизировать наш поиск, иначе можем получить неверные результаты.


© Kalashnikova Anastasia, 2015