Главная | На страницу выбора семестров | Второй семестр |
Введение
В данном практикуме я изучил основы работы с базой данных Uniprot: получение информации из записей базы данных, анализ белковых кластеров, инструменты поиска по базе данных.Задание 1
Uniprot ID | E8YVR4_9BURK |
Uniprot AC | E8YVR4 |
RefSec ID | WP_013591072.1 |
PDB ID | 3K0L, 5BMZ, 4RGR, 4RGS, 4RGU, 4RGX |
Длина, а.о. | 166 |
Молекулярная масса, Да | 18486 |
Название (SubName) | Регуляторный белок MarR (англ. Regulatory protein MarR ) |
Организм | Burkholderia sp. CCGE1001 |
Задание 2
Cluster ID | UniRef100_E8YVR4 | UniRef90_E8YVR4 | UniRef50_A0A095W948 |
Название кластора | Regulatory protein MarR | Regulatory protein MarR | MarR family transcriptional regulator |
Количество белков в кластере | 2 | 13 | 261 |
Названия организмов | Burkholderia sp. CCGE1001, Paraburkholderia phenoliruptrix BR3459a | Burkholderia sp. JPY366, Burkholderia sp. HB1, Paraburkholderia dilworthii, Paraburkholderia caledonica, Burkholderia sp. CCGE1001, Paraburkholderia phenoliruptrix BR3459a и др. | Collimonas fungivorans, Pandoraea pulmonicola, Mumia flava, Ralstonia sp. MD27 и др. |
Задание 3
Номер запроса | Формулировка запроса | Количество результатов | Результатов из Swiss-Prot |
1 | name:regulatory name:protein name:marr | 2551 | 0 |
2 | name:"regulatory protein marr" | 1866 | 0 |
3 | name:marr | 88088 | 3 |
4 | name:"regulatory protein marr" taxonomy:"Bacteria [2]" | 1753 | 0 |
5 | name:"regulatory protein marr" taxonomy:"Archaea [2157]" | 89 | 0 |
6 | name:marr taxonomy:"Burkholderiaceae [119060]" | 5306 | 0 |
7 | name:"regulatory protein marr" AND organism:"Burkholderia sp. CCGE1001 [640510]" | 7 | 0 |
8 | name:"regulatory protein marr" taxonomy:"Burkholderiaceae [119060]" | 72 | 0 |
9 | name:"regulatory protein marr" taxonomy:"Proteobacteria [1224]" | 691 | 0 |
10/td> | name:lysozyme | 18905 | 229 |
11 | name:lysozyme taxonomy:"Arthropoda [6656]" | 593 | 17 |
12 | name:lysozyme taxonomy:"Vertebrata [7742]" | 775 | 123 |
13 | name:lysozyme taxonomy:"Viridiplantae [33090]" | 17 | 3 |
14 | name:trypsin | 14034 | 310 |
15 | name:trypsin NOT name:inhibitor | 11050 | 101 |
16 | name:trypsin name:inhibitor | 2984 | 209 |
16 | name:trypsin inhibitor | 3032 | 215 |
Задание 4
Сравнение проводилось на примере записи E8YVR4 в Uniprot и WP_013591072.1 в RefSeq. Последовательности даны идентичные, но молярная масса в Uniprot приведена на 131 г/моль больше, или 100,713% от данных RefSeq. В Uniorot указана точная систематика организма, откуда взят этот белок, в Refseq же указано сиситематика по семейство включительно. Если говорить о ссылках на источники и ID белка в других БД, то Uniprot однозаначно выделяется: в записи присутствует порядка 15-20 различных идентификаторов для других БД и дана статья, в RefSeq ни того, ни другого не указывается. Однако в RefSeq указывается информация о разичных участках в последовательности, их наименование и классификация.Задание 5
История изменений записи Uniprot описана на примере записи E8YVR4. В истории записи 34 версии, включая текущую. Первая запись создана 5 апреля 2011 года, последняя - 15 февраля 2017. Последовательность белка остается неизменной с первой записи. В первой записи присутствует только EMBL ID, затем постепенно добавляются идентификаторы записей в других БД. Уже с третьей версии добавлены ссылки на многие БД, из тех что есть сейчас. Некоторые ID менялись со временем, как у RefSeq. Последнее существенное изменение сделано чуть более года назад, где указано описание белкового домена.Задание 6
Нестандартные аминокислоты в Uniprot указываются в полях KW и FT, в поле FT помечается как NON_STD. Запись Q8TTA5KW Complete proteome; Methanogenesis; Methyltransferase;Pyrrolysine ; KW Reference proteome; Transferase. ... FT NON_STD 356 356 Pyrrolysine. {ECO:0000250}.или P24183.
KW Metal-binding; Molybdenum; NAD; Oxidoreductase; Periplasm; KW Reference proteome;Selenocysteine; Signal. ... FT NON_STD 196 196 Selenocysteine.Дисульфидные мостики обозначаются как DISULFID, тиоэфиры и сложные сульфидные эфиры помечаются как CROSSLINK. Запись P14046 (сложный тиоэфир)
FT DISULFID 1355 1470 {ECO:0000250}. FT CROSSLNK 975 978 Isoglutamyl cysteine thioester (Cys-Gln).и P24183 (тиоэфир).
FT CROSSLNK 1 18 Beta-methyllanthionine (Cys-Thr).Гликолизирование и липидизация указываются соответственно как CARBOHYD и LIPID; Фосфорилирование обозначается как модифицированный остаток (MOD_RES), справа в поле FT указывается остаток какой аминокислоты фосфорилирован. Запись Q09470.
FT MOD_RES 446 446 Phosphoserine; by PKA. FT {ECO:0000305|PubMed:23774215}. FT LIPID 243 243 S-palmitoyl cysteine. FT {ECO:0000269|PubMed:15837928}. FT CARBOHYD 207 207 N-linked (GlcNAc...). {ECO:0000255}.Естественные вариации и изоформы указаны как VAR_SEQ, также изменения в одно аминокислоту описаны под ключом VARIANT, оговорены последствия такой замены. Даны ссылки на описание соответствующих изоформ в статьях. Запись P04150.
FT VAR_SEQ 728 777 VVENLLNYCFQTFLDKTMSIEFPEMLAEIITNQIPKYSNGN FT IKKLLFHQK -> NVMWLKPESTSHTLI (in isoform FT Beta, isoform Beta-B, isoform Beta-2 and FT isoform GR-A beta). FT {ECO:0000303|PubMed:2867473}. FT /FTId=VSP_003703. ... FT VARIANT 72 72 N -> D (polymorphism; associated in cis FT with A-321 and S-766 in one individual; FT doubles transactivation potential). FT {ECO:0000269|PubMed:21701417}. FT /FTId=VAR_075797.Вообще, многие значимые изменения и особенности в структуре и последовательности белка отражены в поле KW, а конкретные случаи, как правило, сопровождены ссылками.
Источники
Страница находится на стадии разработки
© Poddyakov Ivan 2016-2017