Поиск по PDB и содержание PDB файлов

Occupancy ≠ 1

Occupancy отражает долю молекул в данной конформации. Для большинства атомов этот коэффициент равен единице, что означает, что во всех молекулах данный атом находится в данной точке (1). В этом пункте необходимо было найти pdb файл, в котором есть атомы с коэффициентом Occupancy, не равным 1. Для этого в БД PDBe был произведен расширенный поиск с параметрами "Experimental method: x-ray diffraction" и "Resolution ≤ 1". В результате была выбрана структура 6mu9 бета-лактамазы. Найденные строчки:
 ATOM     32  CA AARG A  51       2.392 -17.245  20.521  0.60  8.52           C  
 ATOM     33  CA BARG A  51       2.375 -17.249  20.536  0.40  8.49           C 
содержит описание атома Cα а.о. ARG51. Первые три числа соответственно x, y, z координаты, а четвертое — коэффициент occupancy. В 60% молекул атом находится в точке с координатами из верхней строчки, а в 40% — из нижней.

Missing residues

Подвижные участки белка обычно не расшифровываются в РСА эксперименте, поэтому их координаты не включаются в pdb-файл и перечисляются в поле Missing residues. Для этого задания был произведен расширенный поиск с параметром "Resolution ≥ 3". Выбранная структура антигена Pfs48/45 (PDB ID: 6e64). Найденные строки:
 REMARK 465 MISSING RESIDUES                                                     
 REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE                       
 REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN               
 REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.)                
 REMARK 465                                                                      
 REMARK 465   M RES C SSSEQI                                                     
 REMARK 465     SER H   130                                                      
 REMARK 465     THR H   131                                                      
 REMARK 465     SER H   132                                                      
 REMARK 465     SER H   215                                                      
 REMARK 465     CYS H   216                                                      
 REMARK 465     GLU L   210                                                      
 REMARK 465     CYS L   211                                                      
 REMARK 465     SER A   130                                                      
 REMARK 465     THR A   131                                                      
 REMARK 465     SER A   132                                                      
 REMARK 465     GLY A   133                                                      
 REMARK 465     GLY A   134                                                      
 REMARK 465     SER A   215                                                      
 REMARK 465     CYS A   216                                                      
 REMARK 465     GLU B   210                                                      
 REMARK 465     CYS B   211                                                      
Видно, что остатки расположены симметрично в разных цепях, причем цепь А расшифрована хуже всего.

Wild type vs Crystal

C PDB структурой белка связаны три последовательности: (1) последовательность природного белка из Uniprot; (2) последовательность белка, который кристаллизовали (может отличаться наличием тэгов, быть частью природного белка); (3) та часть последовательности (2), которую удалось кристаллизовать. В данном пункте необходимо привести один пример, в котором (1) и (2) не совпадают. Для этого в БД RCSB PDB был проведен расширенный поиск с параметрами "EXPERIMENTAL METHOD: X-ray" и "SEQUENCE FEATURES: Wild Type protein". Была выбрана структура 5ytb. Найденные строчки:
 REMARK 999 NATURAL MUTATION AT THIS POSITION                                    
 DBREF  5YTB A    1   216  UNP    P62826   RAN_HUMAN        1    216             
 DBREF  5YTB B   62   200  UNP    P41920   YRB1_YEAST      62    200             
 DBREF  5YTB C    1   376  UNP    P30822   XPO1_YEAST       1    376             
 DBREF  5YTB C  414  1052  UNP    P30822   XPO1_YEAST     414   1052             
 SEQADV 5YTB ALA A  197  UNP  P62826    TYR   197 ENGINEERED MUTATION            
 SEQADV 5YTB GLY C   -1  UNP  P30822              EXPRESSION TAG                 
 SEQADV 5YTB ALA C    0  UNP  P30822              EXPRESSION TAG                 
 SEQADV 5YTB GLY C  537  UNP  P30822    ASP   537 ENGINEERED MUTATION            
 SEQADV 5YTB CYS C  539  UNP  P30822    THR   539 ENGINEERED MUTATION            
 SEQADV 5YTB GLU C  540  UNP  P30822    VAL   540 ENGINEERED MUTATION            
 SEQADV 5YTB GLN C  541  UNP  P30822    LYS   541 ENGINEERED MUTATION            
 SEQADV 5YTB CYS C 1022  UNP  P30822    TYR  1022 SEE SEQUENCE DETAILS
В поле DBREF указывается кросс-референсы между текущей последовательностью (прописанной в поле SEQRES) и последовательностями других БД (2). Поле SEQADV показывает отличия последовательности данного pdb-файла, указанной в поле SEQRES, от последовательности, описанной в поле DBREF (2). В последней строчке комментарий к мутации слишком длинный, поэтому он помещается в поле RECORD 999, которое показано в первой строчке.

Худший и лучший B-фактор

B-фактор (температурный фактор) отражает движение атома и пропорционален величине "размазываниея" его электронной плотности. Значения ниже 10Å говорят о малой подвижности атома, выше 50Å — о высокой подвижности, т.ч. атом едва видно (1). Я рассматривала ту же структуру, что и в первом пункте. Найденные строчки с лучшим и худшим В-фактором (последнеее число в строчке):
 ATOM    424  N   VAL A  96       2.031   6.550  -5.134  1.00  2.91           N  
 ATOM     46  NH1AARG A  51       2.541 -17.997  25.910  0.60 27.67           N

Ссылки

[1] Guide to Understanding PDB Data // RCSB PDB
[2] Primary Structure Section // wwPDB