1.Общая информация о белке
Таблица 1. Общая информация о белке Q816E8
Uniprot ID | Q816E8_BACCR |
Uniprot AC | Q816E8 |
RefSec ID | NP_834586.1, WP_000553305.1 |
PDB ID | 3BVS, 3JX7, 3JXY, 3JXZ, 3JY1,
5CL3, 5CL4, 5CL5, 5CL6, 5CL7, 5CL8, 5CL9, 5CLA, 5CLB, 5CLC,
5CLD,5CLE, 5KUB |
Количество аминокислотных остатков | 237 |
Молекулярная масса, Да | 28 189 |
Организм | Bacillus cereus |
Поиск велся по идентификатору PDB 3BVS. Этот белок упоминался в 5 публикациях, из названия которых мы можем судить о том,
что он участвует в репарации алкилированных оснований. Рекомендованного названия
у него нет, указано только предложенное название (SubName Full=Uncharacterized protein).
идентификатор нуклеотидной последовательности RefSeq: NC_004722.1, его существование
подтверждено на уровне белка (protein evidence). Находится в автоматической базеданных
(Unreviewed, TrEMBL), состоит из 1 цепи. Интересно, что этот белок
содержит домен, сложенный по типу армадилло (armadillo (ARM)-like fold), содержащий
много спиральную укладку из регулярных правозакрученных альфа-спиралей. Данная структура
характерна для белков, связывающихсяс большими субстратами, такими как ДНК [1].
Кроме того он содержит домен изальфа-спиралей, характерный для
белков, осуществляющих репарацию алкилированнных оснований. Эту информацию я получила
при анализе поля Family and domain databases.
При анализе базы данных STRING [2] я узнала о том, что данный белок предположитльно
взаимодествует с тремя другими белками: с BC2004 и BC2466 связь предполагается на основе
их совместной всречаемости (cooccurrence), а с BC4912 на основе их соседства (neighborhood).
2.Описание кластеров Uniref Q816E8
Таблица 2. Описание кластеров Uniref для белка Q816E8
ClusterID | UniRef100_A0A0T8KLG7 | UniRef90_A0RKA7 | UniRef50_A0RKA7 |
Иденичность | 100% | 90% | 50% |
Cluster name | DNA alkylation repair protein | DNA-7-methylguanine glycosylase |
DNA-7-methylguanine glycosylase |
Количество белков, входящих в кластера | 6 | 280 | 312 |
Названия организмов |
Streptococcus pneumoniae
Bacillus cereus VD200
Bacillus cereus BDRD-Cer4
Bacillus cereus VD196
Bacillus cereus (strain ATCC 14579 / DSM 31 / JCM 2152 / NBRC 15305 / NCIMB 9373 / NRRL B-3711)
Bacillus thuringiensis (strain BMB171) |
Bacillus thuringiensis (strain Al Hakam)
Bacillus cereus (strain 03BB102)
Bacillus cereus 03BB108
Bacillus cereus BGSC 6E1
Bacillus anthracis
Bacillus cereus
Bacillus cereus 95/8201
Bacillus anthracis str. H9401
Bacillus thuringiensis subsp. konkukian (strain 97-27)
Bacillus thuringiensis serovar andalousiensis BGSC 4AW1 |
Bacillus thuringiensis (strain Al Hakam)
Bacillus cereus (strain 03BB102)
Bacillus cereus 03BB108
Bacillus cereus BGSC 6E1
Bacillus anthracis
Bacillus cereus
Bacillus cereus 95/8201
Bacillus anthracis str. H9401
Bacillus thuringiensis subsp. konkukian (strain 97-27)
Bacillus thuringiensis serovar andalousiensis BGSC 4AW1 |
Как видно из таблицы 2, белков, идентичных данному, нашлось 6 штук, а белков,
совпадающих на 90% - 280. Организмы, у которых найденыэти белки принадлежат к роду
Bacillus, что свидетельнствует о том, что этот белок достаточно специфичен.
Так как разница в количестве белков, идентичных на 90% и на 50% небольшая (280 и 312),
можно предположить, что этот белок довольно консервативен.
3.Сеансы поиска Uniprot
Таблица 3. Результаты поиска
Характер поиска | Запрос | Количество найденных белков | Из них в базе Swiss-Prot |
По названию | name:alkd | 152 (из них 149 у Бактерий и 3 у Эуархеот) | 0 |
По названию | name:dna glycosylase | 86 410 (из них 2 310 у Архей, 78 008 у Бактерий, 5 166 у Эукариот, 552 у вирусов и 374 неклассифицированных образца) | 1 352 |
По названию | name:dna alkylation repair protein | 3 076 (из них 51 у Архей, 2 999 у Бактерий, 12 у Билатерий, 14 у Грибов) | 31 |
По роду | name:alkd taxonomy:bacillus | 3 | 0 |
По отряду | name:alkd taxonomy:bacillales | 6 | 0 |
По отделу | name:alkd taxonomy:firmicutes | 15 | 0 |
По названию | name:tubulin | 48 265 | 675 |
По таксону | name:tubulin taxonomy:vertebrata | 5 711 | 259 |
По таксону | name:tubulin taxonomy:arthropoda | 5 246 | 37 |
По названию | name:trypsin | 13 241 | 310 |
По названию | name:"trypsin inhibitor" | 2 815 | 197 |
По названию | name:trypsin NOT inhibitor | 10 231 | 95 |
Так как рекомендованного названия для данного белка в базе Uniprot не было,
при поиске я воспользовалась назваием из базы pdb [3].
Из таблицы 3 видно, что белки, похожие на данный, репарирующие алкилированные основания,
характерны в большинстве своем для домена Бактерии.
Кроме этого был проведен поиск по названию тубулина. Видно, что для позвоночных известно
в 5 раз больше его разновидностей, чем у членистоногих.
Из последнего задания стало ясно, что поисковые запросы стоит вводить
максимально конкретно. Например, из 310 белков, найденных по запросу "тубулин", 197
оказались его ингибиторами.
4. Отличия записи RefSeq от Uniprot
Было найдено две записи в базе RefSeq, характерные для данного белка:
NP_834586.1 и
WP_000553305.1.
Как и в базе Uniprot, в базе RefSeq указана аминокислотная последовательность белка и его
длина в аминокислотных остатках, систематическое положение организма, содержащего
данный белок, список статей, содержащих упоминание об этом белке. В поле 'Features' указана молекулярная масса белка, название кодирующей
последовательности, характерной для данного белка.
Кроме того есть информация о консервативных доменах [4] и о типе генетического кода,
используемого для расшифровки последовательности ДНК. Например, для Бактерий, Архей
и растительныхпластид использется код 11[5].
Однако данная база данных содержит мало информации непосредственно о белке, а именно,
мало ссылок на другие базы данных (таких как PDB и STRING), нет описания функций белка.
Поэтому если необходима подробная информация о белке, лучше использовать Uniprot.
5. История изменения записи UniProtKB - U5XQR6_TRYCR
Этот белок называется серин/треонин фосфотазой РР1, принадлежит организму
Trypanosoma cruzi. Запись была редактирована 2 раз. Появилась 22 января 2014 года,
последня редакция - 30 ноября 2016 года. Изменения появляются каждый год, по 3-6
изменений за год. Если
сравнить
первую и последнюю редакции записей, можно увидеть, что были добавлены много ссылок на
разные базы данных, такие как STRING, InterPro, Pfam и другие. Также добавлена информация
о таксоне организма и о домене белка.
6. Изучение представления нестандартных явлений в Uniprot
Одной из частых посттрансляционных модификаций белка является гликозилирование,
которое делится на 3 типа: N-,O-, и С- связанные с белками, иногда еще отдельно
выделяют гликирование (неферментативное присоединение саъаров к атомам азота у беков,
известное как реакция Майлларда).
В записи находится в разделе FT, а если конкретного сайта гликозилирования не выделено,
то в разделе CC, в описании посттрансляционных модификаций.
Пример описания гликозилирования белка P54939
FT CARBOHYD 1486 1486 O-linked (GlcNAc).
FT {ECO:0000269|PubMed:1629228}.
FT /FTId=CAR_000155.
FT CARBOHYD 1889 1889 O-linked (GlcNAc).
FT {ECO:0000269|PubMed:1629228}.
FT /FTId=CAR_000156. |
Пример описания гликозилирования белка P17590 с невыясненным сайтом гликозилирования
CC -!- PTM: N-glycosylated and probably also O-glycosylated. |
Пример описания гликозилирования белка P68871 с сайтами гликирования
FT CARBOHYD 2 2 N-linked (Glc) (glycation); in Hb A1c.
FT CARBOHYD 9 9 N-linked (Glc) (glycation).
FT CARBOHYD 18 18 N-linked (Glc) (glycation).
FT CARBOHYD 67 67 N-linked (Glc) (glycation).
FT CARBOHYD 121 121 N-linked (Glc) (glycation).
FT CARBOHYD 145 145 N-linked (Glc) (glycation); alternate. |
Также из секции 'help' я узнала об описании сайтов связывания кальция. Самым популярным
доменом связывания является EF-домен, состоящийиз спирали-поворота-спирали. Обычно
описывается в разделе FT записи Uniprot.
Пример описания сайтов связывания кальция белка P05937
FT CA_BIND 24 35 1.
FT CA_BIND 111 122 2.
FT CA_BIND 155 166 3.
FT CA_BIND 199 210 4.
|
Однако сайты связывания с кальцием не ограничиваются только EF-доменами. Наличие
таких сайтов определяется экспериментально и в записи отражается следующим образом:
Пример описания сайтов связывания кальция белка P15381
FT SITE 393 393 Calcium ion selectivity and permeability.
FT {ECO:0000269|PubMed:8232554}.
FT SITE 736 736 Calcium ion selectivity and permeability.
FT {ECO:0000269|PubMed:8232554}.
FT SITE 1145 1145 Calcium ion selectivity and permeability.
FT {ECO:0000269|PubMed:8232554}.
FT SITE 1446 1446 Calcium ion selectivity and permeability.
FT {ECO:0000269|PubMed:8232554}.
|
7. Список литературы
[1] http://www.ebi.ac.uk/interpro/entry/IPR016024
[2] http://string-db.org/cgi/network.pl?taskId=degbK2N22BSl
[3] http://www.rcsb.org/pdb/explore/explore.do?structureId=3BVS
[4] https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?uid=132881
[5] https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c#SG11
[6] http://www.uniprot.org/uniprot/P16113