Uniprot и Refseq Protein

В таблице представлена информация об анаэробной рибонуклеотид редуктазе из организма Thermotoga maritima

Uniprot ID Q9WYL6_THEMA
Uniprot AC Q9WYL6; G4FHU6
Refseq ID NP_228195.1, WP_004083208.1
PDB ID 4COI; 4COJ; 4COL; 4COM; 4CON; 4U3E
длина 651 AК остатков
молекулярная масса 75581 Да
рекомендуемое Unirpot название --

В записи нет поля RecName.

Кластеры, включающие данный белок

Кластер Описание ID кластера Кол-во белков в кластере
UniRef100 Объединяет идентичные последовательности и суб-фрагменты с минимум 11 остатками из разных организмов в одну запись UniRef100_Q9WYL6 1
UniRef90 Объединяет последовательности, минимум на 90% идентичные и на 80% перекрывающиеся с самой длинной последовательностью в кластере. UniRef90_Q9WYL6 10
UniRef50 Объединяет последовательности, минимум на 50% идентичные и на 80% перекрывающиеся с самой длинной последовательностью в кластере. UniRef50_Q9WYL6 19

В кластер UniRef100 входит один белок. В кластеры UniRef50 и UniRef90 входят белки из организма одного рода Thermotoga , но разных видов: Thermotoga maritima, Thermotoga naphthophila, Thermotoga petrophila, Thermotoga naphthophila, Thermotoga neapolitana.

Описание сеансов поиска в Unirpot и их результаты

Для каждого поиска указан текст запроса, сколько нашлось белков, сколько из них — из раздела Reviewed (т.е. Swiss-Prot).

Поиск по рекомендованному названию своего белка.

На самом деле, у данного белка нет рекомендованного названия, поэтому используем Submitted name (SubName): «Ribonucleotide reductase of class III (Anaerobic), large subunit»

Текст поиска:
name:"ribonucleotide reductase of class 3 anaerobic large subunit"
Количество белков
252
Все Unreviewed

___________________

Текст поиска:
name:"ribonucleotide reductase"
Количество белков
5828
Из них Reviewed ( Swiss-Prot)
204

___________________

Текст поиска:
name:"ribonucleotide reductase" name:anaerobic
Количество белков
667
Из них Reviewed ( Swiss-Prot)
8

___________________

Текст поиска:
name:"ribonucleotide reductase of class 3" name:anaerobic
Количество белков
389
Из них Reviewed ( Swiss-Prot)
0

Поиск по тому же названию среди белков из организмов того же семейства (family).

Таксономическое положение организма указано в поле ОС. Пользуясь базой NCBI Taxonomy, выяснили, что Thermotoga maritima относится к семейству Thermotogaceae, к отделу Thermotogae

Cодержимое поля ОС
Bacteria; Thermotogae; Thermotogales; Thermotogaceae; Thermotoga. [NCBI Taxonomy]
Поиск по семейству
Текст поиска:
taxonomy:thermotogaceae
Количество белков
25608
Из них Reviewed ( Swiss-Prot)
1496

___________________

Поиск по отделу
Текст поиска:
taxonomy:thermotogae
Количество белков
64,568
Из них Reviewed ( Swiss-Prot)
2381

Проведем поиск по названию белка в разных таксонах

Проведем поиск по названию lysozyme (лизоцим – антибактериальный агент, гидролизует муреин и таким образом разрушает клеточные стенки бактерий) в трех вариантах:

Без ограничения на организмы
Текст поиска:
name:lysozyme
Количество белков
15,096
Из них Reviewed ( Swiss-Prot)
224
Дополнительно
Если искать просто lysozyme, тогда получам 125,021 записей, из которых 979 аннотированных.

___________________

В крупном таксоне Metazoa:
Текст поиска:
name:lysozyme taxonomy:metazoa
Количество белков
1313
Из них Reviewed ( Swiss-Prot)
148

___________________

В более мелком таксоне Аrthropoda
Текст поиска:
name:lysozyme taxonomy:arthropoda
Количество белков
492
Из них Reviewed ( Swiss-Prot)
17

Поиск по названию трипсин

Текст поиска:
name:trypsin
Количество белков
11134
Из них Reviewed ( Swiss-Prot)
301

____________________

Текст поиска:
name:trypsin name:inhibitor
Количество белков
2791
Из них Reviewed ( Swiss-Prot)
203

Если искать «trypsin inhibitor» то в основном находятся ингибиторы трипсина или ингибиторы других белков. На самом деле, отдельно слов "трипсин" (не ингибитор) мне не встретилось, но я просмотрела, возможно не достаточно внимательно, только первые 10 страниц, по 100 записей на каждой.