Поиск по PDB. Содержание PDB файлов

Пример атомов с коэффициентом Occupancy, не равным 1

Указав в "Advanced search" X-ray resolution от 0 до 1 Å, я обнаружила структуру одиночного домена человеческого антитела SD84 6CNW, в PDB файле которого мною были найдены строчки:

ATOM    299  CA ACYS A  22    2.498   -27.271   8.248   0.56   7.65              C  
ANISOU  299  CA ACYS A  22    1036    927       945     159    -168   -155       C  
ATOM    300  CA BCYS A  22    2.611   -27.259   8.192   0.44   6.00              C  
ANISOU  300  CA BCYS A  22    691     808       782     65     -161    -92       C  

Стоит пояснить, что в строчках ATOM после указания названия полипептидной цепи (А) и номера аминокислотного остатка в этой цепи (22) следуют координаты x, y и z, определяющие положение центра атома в пространстве, а затем указан как раз коэффициент Occupancy, B-фактор (температурный фактор) и тип атома. Хочу также обратить внимание, что в выбранной структуре для Cα атомов Cys 22 указан еще и анизотропный температурный фактор (ANISOU), который в отличие от B-фактора характерезует не центрическое, а смещенное (эллипсоидное) расплывание электронной плотности отдельного атома. Коэффициент Occupancy означает долю кристаллических ячеек, в которых данный атом имеет именно такой набор координат. Соответственно в 56 % случаев Cα атом Cys 22 находится в точке (2.498, -27.271, 8.248), а в 44 % случаев - в точке (2.611, -27.259, 8.192), что может говорить о подвижности данного атома в белке.

Пример нерасшифрованных аминокислотных остатков
(Missing residues)

Указав в "Advanced search" X-ray resolution от 3 до 10 Å, я обнаружила структуру киназы TBK1 6CQ4, в PDB файле которого мною были найдены строчки:

REMARK 465 MISSING RESIDUES                                                     
REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE                       
REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN               
REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.)                
REMARK 465                                                                      
REMARK 465   M RES C SSSEQI                                                     
REMARK 465     SER A    -2                                                      
REMARK 465     ASN A    -1                                                      
REMARK 465     ILE A    43                                                      
REMARK 465     SER A    44                                                      
REMARK 465     PHE A    45                                                      
REMARK 465     LEU A    46                                                      
REMARK 465     ARG A    47                                                      
REMARK 465     PRO A    48                                                      
REMARK 465     VAL A    49                                                      
REMARK 465     ASP A    50                                                      
REMARK 465     GLY A   159                                                      
REMARK 465     ALA A   160                                                      
REMARK 465     ALA A   161                                                      
REMARK 465     ARG A   162                                                      
REMARK 465     GLU A   163                                                      
REMARK 465     LEU A   164                                                      
REMARK 465     GLU A   165                                                      
REMARK 465     ASP A   166                                                      
REMARK 465     ASP A   167
...

Здесь представлен неполный список тех аминокислотных остатков, которые не удалось расшифровать методом рентгено-структурного анализа (PCA). Как правило в эту категорию попадают очень подвижные остатки, которые при кристаллизации всего белка не "затвердевают" единым образом. Интересно заметить, что тут можно встретить отрицательные номера остатков, если N-конец белка лабилен.

Пример несовпадения последовательности природного белка (UniProt) и последовательности закристаллизованного белка

C PDB структурой белка связаны три последовательности: (1) последовательность природного белка из UniProt; (2) последовательность белка, который кристаллизовали - он может отличаться наличием тэгов, и быть частью природного белка, например, доменом; (3) та часть последовательности (2), которую удалось кристаллизовать. Чтобы привести пример такой структуры, у которой не совпадают (1) и (2), в поле "Advanced search" я выбрала Wild Type Protein с параметрами:

  • Include Expression Tags: Yes
  • Percent coverage of UniProt sequence: Any.

Таким образом, я обнаружила структуру фосфоглицератмутазы 1 5Y64, в PDB файле которой мною были найдены строчки:

DBREF  5Y64 B    1   254  UNP    P18669   PGAM1_HUMAN      1    254             
DBREF  5Y64 C    1   254  UNP    P18669   PGAM1_HUMAN      1    254             
SEQADV 5Y64 LEU B  255  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 GLU B  256  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  257  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  258  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  259  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  260  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  261  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS B  262  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 LEU C  255  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 GLU C  256  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  257  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  258  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  259  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  260  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  261  UNP  P18669              EXPRESSION TAG                 
SEQADV 5Y64 HIS C  262  UNP  P18669              EXPRESSION TAG

В поле DBREF указан идентификатор P18669 (PGAM1_HUMAN) аминокислотной последовательности природного белка из базы данных UniProt, состоящий из 254 остатков. А под SEQADV перечислены аминокислоты, входящие в состав тэга, который был генноинженерно введен в последовательность белка (в нашем случае на С-конец) для удобства его выделения и (возможно) увеличения стабильности. Также в PDB файле данной структуры содержится внушительный перечень нерасшифрованных аминокислотных остатков, которые соответствуют N и C-концам белка:

REMARK 465 MISSING RESIDUES                                                     
REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE                       
REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN               
REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.)                
REMARK 465                                                                      
REMARK 465   M RES C SSSEQI                                                     
REMARK 465     MET B     1                                                      
REMARK 465     ALA B     2                                                      
REMARK 465     GLU B   236                                                      
REMARK 465     GLU B   237                                                      
REMARK 465     THR B   238                                                      
REMARK 465     VAL B   239                                                      
REMARK 465     ARG B   240                                                      
REMARK 465     LYS B   241                                                      
REMARK 465     ALA B   242                                                      
REMARK 465     MET B   243                                                      
REMARK 465     GLU B   244                                                      
REMARK 465     ALA B   245                                                      
REMARK 465     VAL B   246                                                      
REMARK 465     ALA B   247                                                      
REMARK 465     ALA B   248                                                      
REMARK 465     GLN B   249                                                      
REMARK 465     GLY B   250                                                      
REMARK 465     LYS B   251                                                      
REMARK 465     ALA B   252                                                      
REMARK 465     LYS B   253                                                      
REMARK 465     LYS B   254                                                      
REMARK 465     LEU B   255                                                      
REMARK 465     GLU B   256                                                      
REMARK 465     HIS B   257                                                      
REMARK 465     HIS B   258                                                      
REMARK 465     HIS B   259                                                      
REMARK 465     HIS B   260                                                      
REMARK 465     HIS B   261                                                      
REMARK 465     HIS B   262
... далее идет примерно такой же список для цепи С

Интересно заметить, что весь тэг вошел в этот список.

Пример лучшего и худшего B-фактора в структуре

В PDB файле структуры из предыдущего пункта я нашла атомы с лучшим (наименьшим) и худшим (наибольшим) B-фактором (последняя цифра в строчках):

ATOM    482  NH1 ARG B  62     -15.395  10.204 -42.814  1.00 27.70           N
ATOM   1875  OD1 ASP B 235     -24.020 -14.224 -39.742  1.00 86.29           O 

Как уже было сказано, B-фактор характеризует размазанность электронной плотности атома относительно предсказанного положения его центра. Что обусловлено небольшой вариабельностью реального положения атомов в кристалле, из-за чего при интегрировании сигналов от каждой молекулы белка на детекторе, мы увидим слегка размытую точку. Значения B-фактора меньше 10 Å2 говорят о "жестком" положении атома, когда значения порядка 50 Å2 - о его высокой подвижности.