"Банк Uniprot"

№1 - Извлекаем из банка данных информацию о нашем белке

Здесь ничего сложного, на самом деле. Мы просто забиваем в терминале Linux следующую команду: entret sw:GLSA1_BACSU. Она нам предлагает создать файл с соответствующим именем. Этот файл лежит в моей директории Pr2 и имеет название glsa1_bacsu.entret. Он и несёт нужную нам информацию

№2 - Открываем документ и заполняем таблицу
Метка поляСодержание
Коды доступаACO31465
Идентификатор записи в БДID GLSA1_BACSU
Название (краткое описание) белкаDERecName: Full=Glutaminase 1; EC=3.5.1.2;
Дата создания документаDT01-JAN-1998, sequence version 1.
Дата последнего исправления аннотацииDT25-JAN-2012, entry version 84.
Число публикаций, использованных при создании документаRN3
Журнал и год самой поздней публикацииRLJ. Bacteriol. 187:4813-4821(2005).
Ключевые словаKW3D-structure; Complete proteome; Hydrolase; Reference proteome.
Ключевые словаKW3D-structure; Complete proteome; Hydrolase; Reference proteome.
Что содержит поле комментариев?CC-!- CATALYTIC ACTIVITY: L-glutamine + H(2)O = L-glutamate + NH(3).

-!- SIMILARITY: Belongs to the glutaminase family. Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms. Distributed under the Creative Commons Attribution-NoDerivs License

Идентификаторы записей PDBRXPubMed=15995196; DOI=10.1128/JB.187.14.4813-4821.2005; MEDLINE=98044033; PubMed=9384377; DOI=10.1038/36786;

№3 - Отвечаем на вопросы о белке
В образовании активного центра участвуют следующие аминокислоты: Ser74 (серин), Lys77 (лизин), Asn126 (аспарагин), Lys268 (лизин), Ser269 (последняя аминокислота характерна для фермента моей бактерии. Это классический изгиб, характерный для бетта-лактамаз. Рассмотренные аминокислоты характерны и для активного центра бетта-лактамаз. Стоит отметить, что в результате экспериментов с соответствующим ингибитором (6-diazo-5-oxo- l-norleucine) было показано, что основную роль в каталитическом центре играет именно серин в положении 74.
В моей записи упомянута следующая статья FUNCTION, AND GENE NAME, в которой разбирается каталитическая активность моего белка, а именно превращение L-глутамина в L-глутамат: L-glutamine + H(2)O = L-glutamate + NH(3).
Основную функцию в каталитическом центре выполняет остаток серина 74 (Ser74). Он основной нуклеофил, как написано в этой статье
Ну и конечно же, понятно, что если заменить Ser74 какой-либо другой аминокислотой, допустим аланином, то фермент не сможет образовывать соответствующие связи с субстратом. Функция фермента нарушится

№4 Составляем таблицу белков, имеющих похожее описание.
Для поиска на swissprot я использовал командную строку и следующую команду: infoseq -only -description sw:"glsa*_*" | grep (запрос) | wc -l. С помощью последнего пункта (wc -l) я считал все строки, выводимые на stdout. Результаты приведены в таблице ниже:
Команда/ЗапросЧисло записей в SwissProtЧисло записей в TrEMBL
3.5.1.21751644
Glutaminase1758672
glutaminase18672
Glutaminase 111333

Дополнительное задание

Я взял белок с похожим описанием из организма Bacillus anthracis. Как и в первом случае, я получил файл в формате entret. Потом сравнил этот белок (2) со своим исходным белком (1).
Метка поляБелок 1Белок 2
Первый код доступаACO31465Q81YY0
Идентификатор последовательности в БДIDGLSA1_BACSUGLSA1_BACAN
Название (краткое описание) белкаDERecName: Full=Glutaminase 1; EC=3.5.1.2;RecName: Full=Glutaminase 1; EC=3.5.1.2;
Дата создания документаDT01-JAN-1998, sequence version 1.01-JUN-2003, sequence version 1.
Дата последнего исправления аннотацииDT25-JAN-2012, entry version 84.16-NOV-2011, entry version 58.
Название организмаOSBacillus subtilisBacillus anthracis
Классификация организма (список таксонов)OCBacteria; Firmicutes; Bacillales; Bacillaceae; BacillusBacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group
Длина последовательностиID327309
Молекулярная масса белкаSQ36187 MW34048 MW
Число публикаций, использованных при создании документаRN33
Журнал и год самой поздней публикацииRLJ. Bacteriol. 187:4813-4821(2005).Submitted (MAY-2004) to the EMBL/GenBank/DDBJ databases
Описание вторичной структурыFT

HELIX 14 25

HELIX 26 31

STRAND 50 54

STRAND 60 65

HELIX 73 75

HELIX 76 88

HELIX 90 94

HELIX 110 114

STRAND 123 125

HELIX 126 135

STRAND 136 140

HELIX 141 156

HELIX 164 173

HELIX 175 186

HELIX 194 205

STRAND 207 209

HELIX 211 222

TURN 223 225

TURN 228 231

HELIX 237 250

HELIX 253 255

HELIX 256 262

STRAND 267 269

STRAND 273 279

TURN 281 284

TURN 288 291

STRAND 293 298

STRAND 306 308

HELIX 309 322

Вторичная структруа не описана
Ключевые словаKW3D-structure; Complete proteome; Hydrolase; Reference proteome.Complete proteome; Hydrolase; Reference proteome
Темы, освещённые в комментарияхCC-!- CATALYTIC ACTIVITY: L-glutamine + H(2)O = L-glutamate + NH(3).

-!- SIMILARITY: Belongs to the glutaminase family. Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms. Distributed under the Creative Commons Attribution-NoDerivs License

То же самое
Особенности последовательностиSQSEQUENCE 327 AA; 36187 MW; BE3A1C2366460287 CRC64SEQUENCE 309 AA; 34048 MW; 56FFE294D77F0B35 CRC64
Идентификаторы записей PDBRXPubMed=15995196; DOI=10.1128/JB.187.14.4813-4821.2005; MEDLINE=98044033; PubMed=9384377; DOI=10.1038/36786; MEDLINE=22608414; PubMed=12721629; DOI=10.1038/nature01586

В итоге можно отметить, что мой первый белок изучен лучше, чем второй. Ему соответствуют более ранние и поздние публикации, а также большее число аннотаций.

Главная