Uniprot

В Таблице 1 представлены всевозможные идентификаторы CRISPR-ассоциированного белка Csn1, взятого из бактерии Mycoplasma gallisepticum S6 (подробнее о бактерии см. ранее). Информация была взята из соответствующей записи Uniprot.
Ссылка

Uniprot IDA0A0F6CLF2_MYCGL
Uniprot ACA0A0F6CLF2
Длина (а.к.)1269
Молекулярная масса (Да)148526
Рекомендуемое Unirpot названиеCRISPR-associated endonuclease Cas9
Таблица 1. Идентификаторы и основные данные.
I. Главные сведения
К сожалению, в базе данных Uniport сушествует только одна, и то еще не проверенная запись, соответствующая данному белку (однако тот же белок, извлеченный из другого организма - Streptococcus pyogenes serotype M1 - изучен куда лучше, см ссылку). И в этой записи нет ни одной ссылки ни на записи PDB, ни на записи RefSeq, из-за чего в таблице 1 отсутствуют строки с соответствующие ID. Однако из нее можно извлечь следующую информацию: это мономер, косвенным доказательством существования белка является гомология с существующими белками (степень достоверности - 3). В белке присутствуют 4 остатка, которые связвают Mg2+ (кофактор), и 2 домена, выполняющие функцию эндонуклеаз (HNH и RuvC-подобный домены). Также белок связывает crRNA и tracrRNA.
II. Кластеры
В соответствующий кластер Uniref100 (ID: UniRef100_A0A0F6CLF2), куда входят белки с последовательностью, совпадающей на 100%, входит только сам этот белок. В соответствующий кластер Uniref90 (ID: UniRef90_A0A0F6CLF2), куда входят белки с последовательностью, совпадающей не менее, чем на 90%, входит 6 белков (включая данный). Все они взяты из Mycoplasma gallisepticum, но штаммы различаются. Соответствующий кластер Uniref50 (ID: UniRef50_A0A0F6CLF2) абсолютно идентичен кластеру Uniref90 (в него входят все те же 6 белков).

III. Поиск

Поиск по белку Cas9 (Csn1)
1) Среди всех организмов
Текст запроса: "crispr associated" endonuclease cas9
Сколько белков: 1214
Сколько из раздела Reviewed: 16
Ссылка
Поиск по тубулину
1) Среди всех организмов
Текст запроса: tubulin
Сколько белков: 83674
Сколько из раздела Reviewed: 1958
Ссылка

2) В исходном организме
Текст запроса: "crispr associated endonuclease cas9" AND organism:"Mycoplasma gallisepticum S6 [1006581]"
Сколько белков: 1
Сколько из раздела Reviewed: 0
Ссылка
2) Среди инфузорий
Текст запроса: tubulin taxonomy:"Ciliophora [5878]"
Сколько белков: 847
Сколько из раздела Reviewed: 35
Ссылка

3) Среди семейства организма (Mycoplasmataceae)
Текст запроса: "crispr associated endonuclease cas9" taxonomy:mycoplasmataceae
Сколько белков: 6
Сколько из раздела Reviewed: 0
Ссылка
3) Среди бурых водорослей
Текст запроса: tubulin taxonomy:phaeophyceae
Сколько белков: 41
Сколько из раздела Reviewed: 4
Ссылка

4) Среди отдела организма (Tenericutes)
Текст запроса: "crispr associated endonuclease cas9" taxonomy:"Tenericutes [544448]"
Сколько белков: 7
Сколько из раздела Reviewed: 0
Ссылка

Поиск по трипсину
1) Включая все белки, в названии которых есть слово трипсин
Текст запроса: name:trypsin
Сколько белков: 14034
Сколько из раздела Reviewed: 310
Ссылка

2) Без ингиботоров
Текст запроса: name:trypsin NOT name:inhibitor
Сколько белков: 11050
Сколько из раздела Reviewed: 101
Ссылка
Соответственно, 2984 белков изначального поиска были ингибиторами.
VI. Примеры представления нетипичных аминокислот
Нестандартные аминокислотные остатки отмечаются в записи Uniprot в поле FT ("feature table"). Они отмечаются как NON_STD. Далее идет номер отстатка и сама аминокислота (см. пример с селеноцистеином).



НАЗАД ➜
© <Рюмина Екатерина>, 2017