На главную

Белок с идентификатором Q816E8

1.Общая информация о белке

Таблица 1. Общая информация о белке Q816E8
Uniprot IDQ816E8_BACCR
Uniprot ACQ816E8
RefSec IDNP_834586.1, WP_000553305.1
PDB ID3BVS, 3JX7, 3JXY, 3JXZ, 3JY1, 5CL3, 5CL4, 5CL5, 5CL6, 5CL7, 5CL8, 5CL9, 5CLA, 5CLB, 5CLC, 5CLD,5CLE, 5KUB
Количество аминокислотных остатков237
Молекулярная масса, Да28 189
ОрганизмBacillus cereus

Поиск велся по идентификатору PDB 3BVS. Этот белок упоминался в 5 публикациях, из названия которых мы можем судить о том, что он участвует в репарации алкилированных оснований. Рекомендованного названия у него нет, указано только предложенное название (SubName Full=Uncharacterized protein). идентификатор нуклеотидной последовательности RefSeq: NC_004722.1, его существование подтверждено на уровне белка (protein evidence). Находится в автоматической базеданных (Unreviewed, TrEMBL), состоит из 1 цепи. Интересно, что этот белок содержит домен, сложенный по типу армадилло (armadillo (ARM)-like fold), содержащий много спиральную укладку из регулярных правозакрученных альфа-спиралей. Данная структура характерна для белков, связывающихсяс большими субстратами, такими как ДНК [1]. Кроме того он содержит домен изальфа-спиралей, характерный для белков, осуществляющих репарацию алкилированнных оснований. Эту информацию я получила при анализе поля Family and domain databases.
При анализе базы данных STRING [2] я узнала о том, что данный белок предположитльно взаимодествует с тремя другими белками: с BC2004 и BC2466 связь предполагается на основе их совместной всречаемости (cooccurrence), а с BC4912 на основе их соседства (neighborhood).

2.Описание кластеров Uniref Q816E8

Таблица 2. Описание кластеров Uniref для белка Q816E8
ClusterIDUniRef100_A0A0T8KLG7UniRef90_A0RKA7UniRef50_A0RKA7
Иденичность100%90%50%
Cluster nameDNA alkylation repair proteinDNA-7-methylguanine glycosylase DNA-7-methylguanine glycosylase
Количество белков, входящих в кластера6280312
Названия организмов Streptococcus pneumoniae
Bacillus cereus VD200
Bacillus cereus BDRD-Cer4
Bacillus cereus VD196
Bacillus cereus (strain ATCC 14579 / DSM 31 / JCM 2152 / NBRC 15305 / NCIMB 9373 / NRRL B-3711)
Bacillus thuringiensis (strain BMB171)
Bacillus thuringiensis (strain Al Hakam)
Bacillus cereus (strain 03BB102)
Bacillus cereus 03BB108
Bacillus cereus BGSC 6E1
Bacillus anthracis
Bacillus cereus
Bacillus cereus 95/8201
Bacillus anthracis str. H9401
Bacillus thuringiensis subsp. konkukian (strain 97-27)
Bacillus thuringiensis serovar andalousiensis BGSC 4AW1
Bacillus thuringiensis (strain Al Hakam)
Bacillus cereus (strain 03BB102)
Bacillus cereus 03BB108
Bacillus cereus BGSC 6E1
Bacillus anthracis
Bacillus cereus
Bacillus cereus 95/8201
Bacillus anthracis str. H9401
Bacillus thuringiensis subsp. konkukian (strain 97-27)
Bacillus thuringiensis serovar andalousiensis BGSC 4AW1

Как видно из таблицы 2, белков, идентичных данному, нашлось 6 штук, а белков, совпадающих на 90% - 280. Организмы, у которых найденыэти белки принадлежат к роду Bacillus, что свидетельнствует о том, что этот белок достаточно специфичен. Так как разница в количестве белков, идентичных на 90% и на 50% небольшая (280 и 312), можно предположить, что этот белок довольно консервативен.

3.Сеансы поиска Uniprot

Таблица 3. Результаты поиска
Характер поискаЗапросКоличество найденных белковИз них в базе Swiss-Prot
По названиюname:alkd152 (из них 149 у Бактерий и 3 у Эуархеот)0
По названиюname:dna glycosylase86 410 (из них 2 310 у Архей, 78 008 у Бактерий,
5 166 у Эукариот, 552 у вирусов и 374 неклассифицированных образца)
1 352
По названиюname:dna alkylation repair protein3 076 (из них 51 у Архей, 2 999 у Бактерий,
12 у Билатерий, 14 у Грибов)
31
По родуname:alkd taxonomy:bacillus30
По отрядуname:alkd taxonomy:bacillales60
По отделуname:alkd taxonomy:firmicutes150
По названиюname:tubulin48 265675
По таксонуname:tubulin taxonomy:vertebrata5 711259
По таксонуname:tubulin taxonomy:arthropoda5 24637
По названиюname:trypsin13 241310
По названиюname:"trypsin inhibitor"2 815197
По названиюname:trypsin NOT inhibitor10 23195

Так как рекомендованного названия для данного белка в базе Uniprot не было, при поиске я воспользовалась назваием из базы pdb [3]. Из таблицы 3 видно, что белки, похожие на данный, репарирующие алкилированные основания, характерны в большинстве своем для домена Бактерии.
Кроме этого был проведен поиск по названию тубулина. Видно, что для позвоночных известно в 5 раз больше его разновидностей, чем у членистоногих.
Из последнего задания стало ясно, что поисковые запросы стоит вводить максимально конкретно. Например, из 310 белков, найденных по запросу "тубулин", 197 оказались его ингибиторами.

4. Отличия записи RefSeq от Uniprot

Было найдено две записи в базе RefSeq, характерные для данного белка: NP_834586.1 и WP_000553305.1. Как и в базе Uniprot, в базе RefSeq указана аминокислотная последовательность белка и его длина в аминокислотных остатках, систематическое положение организма, содержащего данный белок, список статей, содержащих упоминание об этом белке. В поле 'Features' указана молекулярная масса белка, название кодирующей последовательности, характерной для данного белка. Кроме того есть информация о консервативных доменах [4] и о типе генетического кода, используемого для расшифровки последовательности ДНК. Например, для Бактерий, Архей и растительныхпластид использется код 11[5].
Однако данная база данных содержит мало информации непосредственно о белке, а именно, мало ссылок на другие базы данных (таких как PDB и STRING), нет описания функций белка. Поэтому если необходима подробная информация о белке, лучше использовать Uniprot.

5. История изменения записи UniProtKB - U5XQR6_TRYCR

Этот белок называется серин/треонин фосфотазой РР1, принадлежит организму Trypanosoma cruzi. Запись была редактирована 2 раз. Появилась 22 января 2014 года, последня редакция - 30 ноября 2016 года. Изменения появляются каждый год, по 3-6 изменений за год. Если сравнить первую и последнюю редакции записей, можно увидеть, что были добавлены много ссылок на разные базы данных, такие как STRING, InterPro, Pfam и другие. Также добавлена информация о таксоне организма и о домене белка.

6. Изучение представления нестандартных явлений в Uniprot

Одной из частых посттрансляционных модификаций белка является гликозилирование, которое делится на 3 типа: N-,O-, и С- связанные с белками, иногда еще отдельно выделяют гликирование (неферментативное присоединение саъаров к атомам азота у беков, известное как реакция Майлларда). В записи находится в разделе FT, а если конкретного сайта гликозилирования не выделено, то в разделе CC, в описании посттрансляционных модификаций.
Пример описания гликозилирования белка P54939
FT   CARBOHYD   1486   1486       O-linked (GlcNAc).
FT                       {ECO:0000269|PubMed:1629228}.
FT                                /FTId=CAR_000155.
FT   CARBOHYD   1889   1889       O-linked (GlcNAc).
FT                     {ECO:0000269|PubMed:1629228}.
FT                                /FTId=CAR_000156.

Пример описания гликозилирования белка P17590 с невыясненным сайтом гликозилирования
CC   -!- PTM: N-glycosylated and probably also O-glycosylated.

Пример описания гликозилирования белка P68871 с сайтами гликирования
FT   CARBOHYD      2      2       N-linked (Glc) (glycation); in Hb A1c.
FT   CARBOHYD      9      9       N-linked (Glc) (glycation).
FT   CARBOHYD     18     18       N-linked (Glc) (glycation).
FT   CARBOHYD     67     67       N-linked (Glc) (glycation).
FT   CARBOHYD    121    121       N-linked (Glc) (glycation).
           FT   CARBOHYD    145    145       N-linked (Glc) (glycation); alternate.

Также из секции 'help' я узнала об описании сайтов связывания кальция. Самым популярным доменом связывания является EF-домен, состоящийиз спирали-поворота-спирали. Обычно описывается в разделе FT записи Uniprot.

Пример описания сайтов связывания кальция белка P05937
FT   CA_BIND      24     35       1.
FT   CA_BIND     111    122       2.
FT   CA_BIND     155    166       3.
FT   CA_BIND     199    210       4.
 

Однако сайты связывания с кальцием не ограничиваются только EF-доменами. Наличие таких сайтов определяется экспериментально и в записи отражается следующим образом:
Пример описания сайтов связывания кальция белка P15381

FT   SITE        393    393       Calcium ion selectivity and permeability.
FT                                {ECO:0000269|PubMed:8232554}.
FT   SITE        736    736       Calcium ion selectivity and permeability.
FT                                {ECO:0000269|PubMed:8232554}.
FT   SITE       1145   1145       Calcium ion selectivity and permeability.
FT                                {ECO:0000269|PubMed:8232554}.
FT   SITE       1446   1446       Calcium ion selectivity and permeability.
FT                                {ECO:0000269|PubMed:8232554}.
 

7. Список литературы


[1] http://www.ebi.ac.uk/interpro/entry/IPR016024
[2] http://string-db.org/cgi/network.pl?taskId=degbK2N22BSl
[3] http://www.rcsb.org/pdb/explore/explore.do?structureId=3BVS
[4] https://www.ncbi.nlm.nih.gov/Structure/cdd/cddsrv.cgi?uid=132881
[5] https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c#SG11
[6] http://www.uniprot.org/uniprot/P16113