Практикум 5: Работа с банком Uniprot

1. Основная информация о белке
UniprotID FMM1_NEIGO
UniprotAC P02974
Refseq ID -
PDB ID 1AY2, 2HI2, 2HIL, 2PIL
Length 165 AA
Molecular wight 17944 D
Recomended name Fimbrial protein

Комментарии к таблице: Таблица описывет основные характеристики белка с рекомендованным названием Fimbrial protein и альтернативными названиями MS11 antigen и Pilin, который кодируется геном pilE1. Это белок является поверхностным антигеном Neisseria gonorrhoeae (Грамм-отрицательной патогенной эубактери) и отвечает за адгезию бактрерии с клетками хозяина. Поиск в ресурсе Uniprot (Retrieve/ID mapping) идентификатору PDB 1AY2, показал результат только после загрузки на сайт PDB-файла. Мне не удалось найти RefSeq ID. Интересно отметить, что этот белок относится к категории "Reviewed" по данным Swiss-Prot и его существование экспериментально подтверждено на белковом уровне. В ресурсе были ссылки на примерно 7 публикаций, посвященных аминокислотным и пострансляционным модификациям описываемого белка.
Ссылка на белок в базе данных белковых взаимодействий: STRING . Отсюда можно сделать вывод, что pilE1 связван со следующими белками: NGFG_01788 (периплазматический белок), NGFG_00235 (pilN), NGFG_01820 (pilE), причем в данном случае, эти связи указывают либо на соседство генов этих белков, либо на то, что они часто встречается "совместно".
Помимо уже названных баз данных, существует большое количество ресурсов, содержащих различного рода информацию об исследуемом белке (Family and domain databases, Miscellaneous databases,Phylogenomic databases, Chemistry databases, и т.д.).
Аминокислотная последвательность:
    10         20         30         40         50
MNTLQKGFTL IELMIVIAIV GILAAVALPA YQDYTARAQV SEAILLAEGQ 
        60         70         80         90        100
KSAVTEYYLN HGKWPENNTS AGVASPPSDI KGKYVKEVEV KNGVVTATML 
       110        120        130        140        150
SSGVNNEIKG KKLSLWARRE NGSVKWFCGQ PVTRTDDDTV ADAKDGKEID 
       160 
TKHLPSTCRD NFDAK 
2. Описание кластеров белка
Идентичность Uniref50 Uniref90 Uniref100
Cluster ID UniRef50_P02974 UniRef90_P02974 UniRef100_P02974
Количество белков 81 6 2
Организмы Neisseria gonorrhoeae
Neisseria meningitidis
Neisseria meningitidis alpha275
Neisseria meningitidis NM2795
Neisseria meningitidis alpha153
Neisseria meningitidis serogroup B (strain alpha710)
Neisseria gonorrhoeae
Neisseria meningitidis
Neisseria gonorrhoeae

Из таблицы видно, что даже при идентичности 50%, все белки встречаются только у рода Neisseria (виды Neisseria gonorrhoeae и Neisseria meningitidis), что вполне логично: поверхностные анигены часто являются очень специфичными белками. Количество белков сходных на 50% (81 белок) резко отличается от 90% (6 белков) и 100% (2 белка).

3. Сеансы поиска в Uniprot
Поиск Текст запроса Количество белков в Swiss-Prot
По названию name: fimbrial protein 39,437 199
По названию среди белков N. gonorrhoeae Protein name:fimbrial protein
organism: Neisseria gonorrhoeae [485]
50 4
По названию внутри семейства Protein name:fimbrial protein
taxonomy: Neisseriaceae [481]
199 10
По названию внутри отдела (типа) Protein name:fimbrial protein
taxonomy: Proteobacteria
19 277 77
Цитохром у всехname:cytochrome 1,691,931 7,555
Цитохром у грибов name:cytochrome taxonomy:"Fungi [4751]" 39 905 583
Цитохром у зелёных растенийname:cytochrome taxonomy:viridiplantae 46,231 1488
Трипсин по названиюname:trypsin14,914 310
Ингибиторы трипсинаname:trypsin name:inhibitor3,189 209

5. История
Последняя запись о моём белке была добавлена в базу неавно: 10 мая 2017, тогда так первые записи с последовательностью датируются 1м ноября 1988 г. Всего в uniprot есть 113 записей по моему белку. Если сравнивать первую запись с последней, то можно отметить, что количество предоставленной информации увеличилось в разы: если првая запись включала в себя название, организм, даты, краткое описание функции и последовательность, то последняя запись содержит также информацию о структуре, кодах в различных базах данных, полное описание функций и так далее.

6. Нестандартные явления в Uniprot
1.Наличие таких нестандартных аминокислотных отстатков, как пирролизин(O) и селеноцистеин(U) дополнительно освещается в записях белков.

2. Последовательности, полученные в результате альтернативного сплайсинга обозначаются как VAR_SEQ:
Источники:
1. www.uniprot.org
2.en.wikipedia.org
3.www.ncbi.nlm.nih.gov
Назад