Практикум 5: Работа с банком Uniprot
1. Основная информация о белке
UniprotID | FMM1_NEIGO |
UniprotAC | P02974 |
Refseq ID | - |
PDB ID | 1AY2, 2HI2, 2HIL, 2PIL |
Length | 165 AA |
Molecular wight | 17944 D |
Recomended name | Fimbrial protein |
Комментарии к таблице: Таблица описывет основные характеристики белка с рекомендованным названием Fimbrial protein и альтернативными названиями MS11 antigen и Pilin,
который кодируется геном pilE1. Это белок является поверхностным антигеном Neisseria gonorrhoeae (Грамм-отрицательной патогенной эубактери) и отвечает за адгезию бактрерии с клетками хозяина.
Поиск в ресурсе Uniprot (Retrieve/ID mapping) идентификатору PDB 1AY2, показал результат только после загрузки на сайт PDB-файла. Мне не удалось найти RefSeq ID. Интересно отметить, что этот белок относится к категории "Reviewed" по
данным Swiss-Prot и его существование экспериментально подтверждено на белковом уровне. В ресурсе были ссылки на примерно 7 публикаций, посвященных аминокислотным и пострансляционным модификациям описываемого белка.
Ссылка на белок в базе данных белковых взаимодействий: STRING . Отсюда можно сделать вывод, что pilE1 связван со следующими белками:
NGFG_01788 (периплазматический белок), NGFG_00235 (pilN), NGFG_01820 (pilE), причем в данном случае, эти связи указывают либо на соседство генов этих белков, либо на то, что они часто встречается "совместно".
Помимо уже названных баз данных, существует большое количество ресурсов, содержащих различного рода информацию об исследуемом белке
(Family and domain databases, Miscellaneous databases,Phylogenomic databases, Chemistry databases, и т.д.).
Аминокислотная последвательность: 10 20 30 40 50
MNTLQKGFTL IELMIVIAIV GILAAVALPA YQDYTARAQV SEAILLAEGQ
60 70 80 90 100
KSAVTEYYLN HGKWPENNTS AGVASPPSDI KGKYVKEVEV KNGVVTATML
110 120 130 140 150
SSGVNNEIKG KKLSLWARRE NGSVKWFCGQ PVTRTDDDTV ADAKDGKEID
160
TKHLPSTCRD NFDAK
2. Описание кластеров белка Идентичность | Uniref50 | Uniref90 | Uniref100 |
Cluster ID | UniRef50_P02974 | UniRef90_P02974 | UniRef100_P02974 |
Количество белков | 81 | 6 | 2 |
Организмы | Neisseria gonorrhoeae Neisseria meningitidis Neisseria meningitidis alpha275 Neisseria meningitidis NM2795 Neisseria meningitidis alpha153 Neisseria meningitidis serogroup B (strain alpha710) | Neisseria gonorrhoeae Neisseria meningitidis | Neisseria gonorrhoeae |
Из таблицы видно, что даже при идентичности 50%, все белки встречаются только у рода Neisseria (виды Neisseria gonorrhoeae и Neisseria meningitidis), что вполне логично:
поверхностные анигены часто являются очень специфичными белками. Количество белков сходных на 50% (81 белок) резко отличается от 90% (6 белков) и 100% (2 белка).
3. Сеансы поиска в Uniprot
Поиск | Текст запроса | Количество белков | в Swiss-Prot |
По названию | name: fimbrial protein | 39,437 | 199 |
По названию среди белков N. gonorrhoeae | Protein name:fimbrial protein organism: Neisseria gonorrhoeae [485] | 50 | 4 |
По названию внутри семейства | Protein name:fimbrial protein taxonomy: Neisseriaceae [481] | 199 | 10 |
По названию внутри отдела (типа) | Protein name:fimbrial protein taxonomy: Proteobacteria | 19 277 | 77 |
Цитохром у всех | name:cytochrome | 1,691,931 | 7,555 |
Цитохром у грибов | name:cytochrome taxonomy:"Fungi [4751]" | 39 905 | 583 |
Цитохром у зелёных растений | name:cytochrome taxonomy:viridiplantae | 46,231 | 1488 |
Трипсин по названию | name:trypsin | 14,914 | 310 |
Ингибиторы трипсина | name:trypsin name:inhibitor | 3,189 | 209 |
5. История Последняя запись о моём белке была добавлена в базу неавно: 10 мая 2017, тогда так первые записи с последовательностью датируются 1м ноября 1988 г. Всего в uniprot есть 113 записей по моему белку. Если сравнивать первую запись
с последней, то можно отметить, что количество предоставленной информации увеличилось в разы: если првая запись включала в себя название, организм, даты, краткое описание функции и последовательность, то
последняя запись содержит также информацию о структуре, кодах в различных базах данных, полное описание функций и так далее.
6. Нестандартные явления в Uniprot 1.Наличие таких нестандартных аминокислотных отстатков, как пирролизин(O) и селеноцистеин(U) дополнительно освещается в записях белков. 2. Последовательности, полученные в результате альтернативного сплайсинга обозначаются как VAR_SEQ:
Источники: 1. www.uniprot.org
2.en.wikipedia.org
3.www.ncbi.nlm.nih.gov
|