Карань Анна |
|||
Главная | О себе | Учеба | ФББ МГУ |
Таблица 1. Общая информация о белке | |
Uniprot ID | Q9JYV4_NEIMB |
Uniprot AC | Q9JYV4 |
Refseq ID | NP_274428.1; WP_002225125.1 |
PDB ID | 2GTQ, 4PU2, 4PVB, 4PW4, 4QHP, 4QIR, 4QME, 4QPE, 4QUO, 5DYF |
Длина | 867 |
Молекулярная масса | 97681Da |
Рекомендуемое Unirpot название | Aminopeptidase N |
Комментарии к таблице. Во всех записях PDB белок представлен одной цепью, и структура известна для всей это цепи. Этот фермент содержит металл цинк, но описан он только для 3-х первых PDB-файлов: 2GTQ, 4PU2 и 4PVB, представлены 3 иона: в положениях 293, 297, 316. В белке выделяют 2 домена, составляющие 75% всего белка.
Таблица 2. Описание кластеров Uniref | ||
Идентификатор кластера | Количество белков в кластере | Еще что-то, заслуживающее внимание |
UniRef50_Q9JYV4 | 190 | Среди организмов встречаются бактерии другого рода |
UniRef90_Q9JYV4 | 135 | Среди организмов все еще встречаются представители друго вида, что является следствием быстроты эволюции бактерий и нечеткого определение понятий рода и вида, особенно у прокариот |
UniRef100_Q9JYV4 | 2 | Здесь бактерии уже одного вида и даже одной серогруппы |
3. Результаты сеансов поиска в Uniprot.
Таблица 3. Результаты сеансов поиска в Uniprot | |||
Текст запроса | Сколько нашлось белков | Сколько белков из раздела Reviewed | |
name:"aminopeptidase n" | 7375 | 26 | |
name:"aminopeptidase n" taxonomy:neisseriaceae | 48 | 0 | |
name:"aminopeptidase n" taxonomy:"Proteobacteria [1224]" | 3772 | 4 | |
name:histone | 85878 | 2045 | |
name:histone taxonomy:"Fungi [4751]" | 16501 | 503 | |
name:histone taxonomy:"Ciliophora [5878]" | 441 | 61 | |
name:trypsin | 11309 | 301 | |
name:trypsin name:inhibitor | 2558 | 203 |
4. Сравнение информации, предоставляемой записями RefSeq и Uniprot
RefSeq не дает ссылки на другие базы данных, в отличие от Uniprot (строки с квалификатором DR)
, что затрудняет быстрое получение всеобъемлющих данных о белке. В Uniprot для каждого белка
огромные списки хэштегов, по которым просто найти близкие по функции, строению и т.д. белки.
Также в Uniprot дается классификация организма, благодаря чему легко узнать встречаемость этого
белка у близкородственных организмов.
Еще одно отличие, в описании особенностей последовательности белка в RefSeq больше конкретных
регионов, сайтов связывания и т.д., а вот информации про металл нет (ну кроме того, что это цинк,
что мы можем узнать из названия центра связывания), в отличие от Uniprot.
Если это обобщить, то можно сказать, что Uniprot удобнее для получения абсолютно полной иформации
о белке, потому что там даются все возможные сыылки на другие базы данных, а также есть все удобства
для поиска этого белка у других организмов, для поиска близкородственных белков или белков, близких
по функции. RefSeq же удобнее наличием более полной конкретной информации об особенностях
последовательности (по крайней мере для моего белка), однако за отсутствием ссылок, другого вы быстро
не получите (ссылки на статьи есть в обеих базах данных).
5. История изменений записи Uniprot данного белка
Первые данные о последовательности появились 1 октября 2000 года, последняя версия - 103-я версия
от 16 марта 2016 года. До 19 версии от 2005.03.01 входящее имя было Q9JYV4, теперь же оно Q9JYV4_NEIMB.
Все версии получаются из базы данных TrEMBL. Далее обновлений, начиная примерно с 2014 начали учащаться.
Последняя версия очень сильно отличается от первой, во-первых появилось больше статей по
исследованию данного белка, что соответстенно значительно увеличило все разделы описания, хотя бы
сами ссылки на статьи. Раздел DR увеличился раз в 20, и таких ссылок как в первой версии там вообще нет, это
связано в увеличичением числа баз данных, с каждой из которых нужно собрать информацию. Появился новый
раздел - KW, с хэштегами, что значительно упростило поиск близкородственных белков, белков,
расположенных в тех же органах и т.д..
Кроме того появился раздел FT с описаниями особенностей белка. Естественно, что в первой версии
его не было, потому что было проведено только одно исследование, соответственно в первой версии не указано,
что это цинк-связывающий белок, не указаны границы различных доменов.
Даже раздел OC с систематикой изменился. В первой версии - "Bacteria; Proteobacteria; beta subdivision; Neisseriaceae; Neisseria",
в последней - "Bacteria; Proteobacteria; Betaproteobacteria; Neisseriales; Neisseriaceae; Neisseria".
6. Представление некоторых необычных записей Uniprot
Таблица 3. Примеры различных явлений в записи Uniprot | |
Явление | Пример |
Нестандартные аминокислотные остатки | P24183: FT NON_STD 196 196 Selenocysteine. Q8TTA5: FT NON_STD 356 356 Pyrrolysine. {ECO:0000250}. |
Посттрансляционные модификации | Гликозилирование. P17590: FT CARBOHYD 3 3 N-linked (GlcNAc...); by host. {ECO:0000255}. |
Дисульфидные мостики | Q43495: FT DISULFID 41 77 {ECO:0000250}. |
Для поиска таких примеров воспользуемся поиском в HELP. Например, чтобы найти нестандартные аминокислоты, введем "Non-standard". Идем по ссылке "Nono-standard residue", где есть ссылки на белки с примерами нестандартных аминокслот. Таким же образом найдем примеры для всех остальных необычных явлений.
©Карань Анна, 2015