№1 - Извлекаем из банка данных информацию о нашем белке
Здесь ничего сложного, на самом деле. Мы просто забиваем в терминале Linux следующую команду: entret sw:GLSA1_BACSU. Она нам предлагает создать файл с
соответствующим именем. Этот файл лежит в моей директории Pr2 и имеет название glsa1_bacsu.entret. Он и несёт нужную нам информацию
№2 - Открываем документ и заполняем таблицу
Метка поля | Содержание | |
Коды доступа | AC | O31465 |
Идентификатор записи в БД | ID | GLSA1_BACSU |
Название (краткое описание) белка | DE | RecName: Full=Glutaminase 1; EC=3.5.1.2; |
Дата создания документа | DT | 01-JAN-1998, sequence version 1. |
Дата последнего исправления аннотации | DT | 25-JAN-2012, entry version 84. |
Число публикаций, использованных при создании документа | RN | 3 |
Журнал и год самой поздней публикации | RL | J. Bacteriol. 187:4813-4821(2005). |
Ключевые слова | KW | 3D-structure; Complete proteome; Hydrolase; Reference proteome. |
Ключевые слова | KW | 3D-structure; Complete proteome; Hydrolase; Reference proteome. |
Что содержит поле комментариев? | CC | -!- CATALYTIC ACTIVITY: L-glutamine + H(2)O = L-glutamate + NH(3). -!- SIMILARITY: Belongs to the glutaminase family. Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms. Distributed under the Creative Commons Attribution-NoDerivs License |
Идентификаторы записей PDB | RX | PubMed=15995196; DOI=10.1128/JB.187.14.4813-4821.2005; MEDLINE=98044033; PubMed=9384377; DOI=10.1038/36786; |
№3 - Отвечаем на вопросы о белке
В образовании активного центра участвуют следующие аминокислоты: Ser74 (серин), Lys77 (лизин), Asn126 (аспарагин), Lys268 (лизин), Ser269 (последняя аминокислота характерна
для фермента моей бактерии. Это классический изгиб, характерный для бетта-лактамаз. Рассмотренные аминокислоты характерны и для активного центра
бетта-лактамаз. Стоит отметить, что в результате экспериментов с соответствующим ингибитором (6-diazo-5-oxo- l-norleucine) было показано, что основную роль
в каталитическом центре играет именно серин в положении 74.
В моей записи упомянута следующая статья FUNCTION, AND GENE NAME, в которой разбирается каталитическая активность моего белка,
а именно превращение L-глутамина в L-глутамат: L-glutamine + H(2)O = L-glutamate + NH(3).
Основную функцию в каталитическом центре выполняет остаток серина 74 (Ser74). Он основной нуклеофил, как написано в этой статье
Ну и конечно же, понятно, что если заменить Ser74 какой-либо другой аминокислотой, допустим аланином, то фермент не сможет образовывать соответствующие связи с субстратом. Функция фермента нарушится
№4 Составляем таблицу белков, имеющих похожее описание.
Для поиска на swissprot я использовал командную строку и следующую команду: infoseq -only -description sw:"glsa*_*" | grep (запрос) | wc -l. С помощью последнего пункта (wc -l) я считал все строки, выводимые на stdout.
Результаты приведены в таблице ниже:
Команда/Запрос | Число записей в SwissProt | Число записей в TrEMBL |
3.5.1.2 | 175 | 1644 |
Glutaminase | 175 | 8672 |
glutaminase | 1 | 8672 |
Glutaminase 1 | 11 | 333 |
Я взял белок с похожим описанием из организма Bacillus anthracis. Как и в первом случае, я получил файл в формате entret. Потом сравнил этот белок (2) со своим исходным белком (1).
Метка поля | Белок 1 | Белок 2 | |
Первый код доступа | AC | O31465 | Q81YY0 |
Идентификатор последовательности в БД | ID | GLSA1_BACSU | GLSA1_BACAN |
Название (краткое описание) белка | DE | RecName: Full=Glutaminase 1; EC=3.5.1.2; | RecName: Full=Glutaminase 1; EC=3.5.1.2; |
Дата создания документа | DT | 01-JAN-1998, sequence version 1. | 01-JUN-2003, sequence version 1. |
Дата последнего исправления аннотации | DT | 25-JAN-2012, entry version 84. | 16-NOV-2011, entry version 58. |
Название организма | OS | Bacillus subtilis | Bacillus anthracis |
Классификация организма (список таксонов) | OC | Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus | Bacteria; Firmicutes; Bacillales; Bacillaceae; Bacillus; Bacillus cereus group |
Длина последовательности | ID | 327 | 309 |
Молекулярная масса белка | SQ | 36187 MW | 34048 MW |
Число публикаций, использованных при создании документа | RN | 3 | 3 |
Журнал и год самой поздней публикации | RL | J. Bacteriol. 187:4813-4821(2005). | Submitted (MAY-2004) to the EMBL/GenBank/DDBJ databases |
Описание вторичной структуры | FT |
HELIX 14 25 HELIX 26 31 STRAND 50 54 STRAND 60 65 HELIX 73 75 HELIX 76 88 HELIX 90 94 HELIX 110 114 STRAND 123 125 HELIX 126 135 STRAND 136 140 HELIX 141 156 HELIX 164 173 HELIX 175 186 HELIX 194 205 STRAND 207 209 HELIX 211 222 TURN 223 225 TURN 228 231 HELIX 237 250 HELIX 253 255 HELIX 256 262 STRAND 267 269 STRAND 273 279 TURN 281 284 TURN 288 291 STRAND 293 298 STRAND 306 308 HELIX 309 322 | Вторичная структруа не описана |
Ключевые слова | KW | 3D-structure; Complete proteome; Hydrolase; Reference proteome. | Complete proteome; Hydrolase; Reference proteome |
Темы, освещённые в комментариях | CC | -!- CATALYTIC ACTIVITY: L-glutamine + H(2)O = L-glutamate + NH(3). -!- SIMILARITY: Belongs to the glutaminase family. Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms. Distributed under the Creative Commons Attribution-NoDerivs License |
То же самое |
Особенности последовательности | SQ | SEQUENCE 327 AA; 36187 MW; BE3A1C2366460287 CRC64 | SEQUENCE 309 AA; 34048 MW; 56FFE294D77F0B35 CRC64 |
Идентификаторы записей PDB | RX | PubMed=15995196; DOI=10.1128/JB.187.14.4813-4821.2005; MEDLINE=98044033; PubMed=9384377; DOI=10.1038/36786; | MEDLINE=22608414; PubMed=12721629; DOI=10.1038/nature01586 |
В итоге можно отметить, что мой первый белок изучен лучше, чем второй. Ему соответствуют более ранние и поздние публикации, а также большее число аннотаций.