Поиск по PDB и содержание PDB-файла

I

Occupancy ≠ 1. Параметр Occupancy отражает долю атомов в данной конформации. Если этот параметр для атома не равен 1, то это может говорить о том, что данный атом в структуре может иметь вариабельные позиции (в зависимости от взаимодействия с соседними структурами в кристалле?). Для поиска структур с такими атомами был использован сервис PDBe с параметрами "Experimental method: x-ray diffraction" и "Resolution ≤ 1". В результате была выбрана структура 3U7C, pdb-файле которой стодержалось следующее описание:

ATOM    751  CA AARG A  89     -16.551  11.329  16.173  0.50  7.04           C
ATOM 752 CA BARG A 89 -16.534 11.361 16.164 0.50 6.72 C

Выделенное выше жирным число 0.5 означает, что в 50% молекул описанный атом находится в точке с координатами из верхней строчки и ещё в 50% — из нижней.

II

Missing residues. Обычно в ходе X-ray эсперимента не рассшифровывают вариабильные участки белка, и координаты таких регионов не включаются в pdb-структуру и описываются в поле Missing residues. В том же PDBe был произведён расширенный поиск с параметром Resolution ≥ 3. Для дальнейшего анализа была выбрана структура 5M7J. В pdb-файле с ней мы можем найти следующие строчки:

REMARK 465 MISSING RESIDUES                                                     
REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE                       
REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN               
REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.)                
REMARK 465                                                                      
REMARK 465   M RES C SSSEQI                                                     
REMARK 465     MET A   -19                                                      
REMARK 465     LYS A   -18                                                      
REMARK 465     GLN A   -17                                                      
...
REMARK 465     GLY D    57                                                      
REMARK 465     GLN D    58                                                      
REMARK 465     VAL D    59                                                      
REMARK 465     TYR D    60                                                      

Видно, что нерасшифрованные остатки группируются вместе, что говорит о целых участках белка с вариабельной конформацией.

III

Wild type vs Crystal. Для выполнения описанного задания в базе данных RCSB PDB был произведен поиск с параметрами "EXPERIMENTAL METHOD: X-ray" и "SEQUENCE FEATURES: Wild Type protein". Был выбран белок 6HUX. В поле DBREF указывается соответствие между закристализованной последовательностью и последовательностью WT. Поле же SEQADV показывает различия внутри данного соответствия. В моём случае всё отличие состоит в наличии у закристализованной структуры экспресионного тэга:

DBREF  6HUX A    1   353  UNP    Q58734   HMDY_METJA       1    353             
SEQADV 6HUX ALA A  354  UNP  Q58734              EXPRESSION TAG                 
SEQADV 6HUX ASP A  355  UNP  Q58734              EXPRESSION TAG                 
SEQADV 6HUX PRO A  356  UNP  Q58734              EXPRESSION TAG                 
SEQADV 6HUX ASN A  357  UNP  Q58734              EXPRESSION TAG                 
...
SEQADV 6HUX HIS A  373  UNP  Q58734              EXPRESSION TAG                 
SEQADV 6HUX HIS A  374  UNP  Q58734              EXPRESSION TAG                 
SEQADV 6HUX HIS A  375  UNP  Q58734              EXPRESSION TAG                 

IV

Худший и лучший B-фактор в структуре. B-фактор (температурный фактор) отражает движение атома и пропорционален величине "размазываниея" его электронной плотности. Значения ниже 10Å говорят о малой подвижности атома, выше 50Å — о высокой подвижности. Для данного задания был использован белок, о котором речь шла и ранее (4PNE). Результат поиска представлен ниже (верхняя строчка — остаток с худшим B-фактор, нижняя — с лучшим. B-фактор — последнее число в строчке):

ATOM    165 HE21 GLN A  17      -2.790  17.081  15.006  1.00 86.04           H  
ATOM   6554  CA  THR B 176       9.124  35.394  37.133  1.00  6.85           C