I
Occupancy ≠ 1. Параметр Occupancy отражает долю атомов в данной конформации. Если этот параметр для атома не равен 1, то это может говорить о том, что данный атом в структуре может иметь вариабельные позиции (в зависимости от взаимодействия с соседними структурами в кристалле?). Для поиска структур с такими атомами был использован сервис PDBe с параметрами "Experimental method: x-ray diffraction" и "Resolution ≤ 1"
. В результате была выбрана структура 3U7C
, pdb-файле которой стодержалось следующее описание:
ATOM 751 CA AARG A 89 -16.551 11.329 16.173 0.50 7.04 C
ATOM 752 CA BARG A 89 -16.534 11.361 16.164 0.50 6.72 C
Выделенное выше жирным число 0.5 означает, что в 50% молекул описанный атом находится в точке с координатами из верхней строчки и ещё в 50% — из нижней.
II
Missing residues. Обычно в ходе X-ray эсперимента не рассшифровывают вариабильные участки белка, и координаты таких регионов не включаются в pdb-структуру и описываются в поле Missing residues. В том же PDBe был произведён расширенный поиск с параметром Resolution ≥ 3
. Для дальнейшего анализа была выбрана структура 5M7J. В pdb-файле с ней мы можем найти следующие строчки:
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 MET A -19 REMARK 465 LYS A -18 REMARK 465 GLN A -17 ... REMARK 465 GLY D 57 REMARK 465 GLN D 58 REMARK 465 VAL D 59 REMARK 465 TYR D 60
Видно, что нерасшифрованные остатки группируются вместе, что говорит о целых участках белка с вариабельной конформацией.
III
Wild type vs Crystal. Для выполнения описанного задания в базе данных RCSB PDB был произведен поиск с параметрами "EXPERIMENTAL METHOD: X-ray"
и "SEQUENCE FEATURES: Wild Type protein"
. Был выбран белок 6HUX. В поле DBREF
указывается соответствие между закристализованной последовательностью и последовательностью WT. Поле же SEQADV
показывает различия внутри данного соответствия. В моём случае всё отличие состоит в наличии у закристализованной структуры экспресионного тэга:
DBREF 6HUX A 1 353 UNP Q58734 HMDY_METJA 1 353 SEQADV 6HUX ALA A 354 UNP Q58734 EXPRESSION TAG SEQADV 6HUX ASP A 355 UNP Q58734 EXPRESSION TAG SEQADV 6HUX PRO A 356 UNP Q58734 EXPRESSION TAG SEQADV 6HUX ASN A 357 UNP Q58734 EXPRESSION TAG ... SEQADV 6HUX HIS A 373 UNP Q58734 EXPRESSION TAG SEQADV 6HUX HIS A 374 UNP Q58734 EXPRESSION TAG SEQADV 6HUX HIS A 375 UNP Q58734 EXPRESSION TAG
IV
Худший и лучший B-фактор в структуре. B-фактор (температурный фактор) отражает движение атома и пропорционален величине "размазываниея" его электронной плотности. Значения ниже 10Å говорят о малой подвижности атома, выше 50Å — о высокой подвижности. Для данного задания был использован белок, о котором речь шла и ранее (4PNE). Результат поиска представлен ниже (верхняя строчка — остаток с худшим B-фактор, нижняя — с лучшим. B-фактор — последнее число в строчке):
ATOM 165 HE21 GLN A 17 -2.790 17.081 15.006 1.00 86.04 H ATOM 6554 CA THR B 176 9.124 35.394 37.133 1.00 6.85 C