Поиск по PDB. Содержание PDB файлов
Пример атомов с коэффициентом Occupancy, не равным 1
Указав в "Advanced search" X-ray resolution от 0 до 1 Å, я обнаружила структуру одиночного домена человеческого антитела SD84 6CNW, в PDB файле которого мною были найдены строчки:
ATOM 299 CA ACYS A 22 2.498 -27.271 8.248 0.56 7.65 C ANISOU 299 CA ACYS A 22 1036 927 945 159 -168 -155 C ATOM 300 CA BCYS A 22 2.611 -27.259 8.192 0.44 6.00 C ANISOU 300 CA BCYS A 22 691 808 782 65 -161 -92 C
Стоит пояснить, что в строчках ATOM после указания названия полипептидной цепи (А) и номера аминокислотного остатка в этой цепи (22) следуют координаты x, y и z, определяющие положение центра атома в пространстве, а затем указан как раз коэффициент Occupancy, B-фактор (температурный фактор) и тип атома. Хочу также обратить внимание, что в выбранной структуре для Cα атомов Cys 22 указан еще и анизотропный температурный фактор (ANISOU), который в отличие от B-фактора характерезует не центрическое, а смещенное (эллипсоидное) расплывание электронной плотности отдельного атома. Коэффициент Occupancy означает долю кристаллических ячеек, в которых данный атом имеет именно такой набор координат. Соответственно в 56 % случаев Cα атом Cys 22 находится в точке (2.498, -27.271, 8.248), а в 44 % случаев - в точке (2.611, -27.259, 8.192), что может говорить о подвижности данного атома в белке.
Пример нерасшифрованных аминокислотных остатков
(Missing residues)
Указав в "Advanced search" X-ray resolution от 3 до 10 Å, я обнаружила структуру киназы TBK1 6CQ4, в PDB файле которого мною были найдены строчки:
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 SER A -2 REMARK 465 ASN A -1 REMARK 465 ILE A 43 REMARK 465 SER A 44 REMARK 465 PHE A 45 REMARK 465 LEU A 46 REMARK 465 ARG A 47 REMARK 465 PRO A 48 REMARK 465 VAL A 49 REMARK 465 ASP A 50 REMARK 465 GLY A 159 REMARK 465 ALA A 160 REMARK 465 ALA A 161 REMARK 465 ARG A 162 REMARK 465 GLU A 163 REMARK 465 LEU A 164 REMARK 465 GLU A 165 REMARK 465 ASP A 166 REMARK 465 ASP A 167 ...
Здесь представлен неполный список тех аминокислотных остатков, которые не удалось расшифровать методом рентгено-структурного анализа (PCA). Как правило в эту категорию попадают очень подвижные остатки, которые при кристаллизации всего белка не "затвердевают" единым образом. Интересно заметить, что тут можно встретить отрицательные номера остатков, если N-конец белка лабилен.
Пример несовпадения последовательности природного белка (UniProt) и последовательности закристаллизованного белка
C PDB структурой белка связаны три последовательности: (1) последовательность природного белка из UniProt; (2) последовательность белка, который кристаллизовали - он может отличаться наличием тэгов, и быть частью природного белка, например, доменом; (3) та часть последовательности (2), которую удалось кристаллизовать. Чтобы привести пример такой структуры, у которой не совпадают (1) и (2), в поле "Advanced search" я выбрала Wild Type Protein с параметрами:
- Include Expression Tags: Yes
- Percent coverage of UniProt sequence: Any.
Таким образом, я обнаружила структуру фосфоглицератмутазы 1 5Y64, в PDB файле которой мною были найдены строчки:
DBREF 5Y64 B 1 254 UNP P18669 PGAM1_HUMAN 1 254 DBREF 5Y64 C 1 254 UNP P18669 PGAM1_HUMAN 1 254 SEQADV 5Y64 LEU B 255 UNP P18669 EXPRESSION TAG SEQADV 5Y64 GLU B 256 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 257 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 258 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 259 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 260 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 261 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS B 262 UNP P18669 EXPRESSION TAG SEQADV 5Y64 LEU C 255 UNP P18669 EXPRESSION TAG SEQADV 5Y64 GLU C 256 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 257 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 258 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 259 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 260 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 261 UNP P18669 EXPRESSION TAG SEQADV 5Y64 HIS C 262 UNP P18669 EXPRESSION TAG
В поле DBREF указан идентификатор P18669 (PGAM1_HUMAN) аминокислотной последовательности природного белка из базы данных UniProt, состоящий из 254 остатков. А под SEQADV перечислены аминокислоты, входящие в состав тэга, который был генноинженерно введен в последовательность белка (в нашем случае на С-конец) для удобства его выделения и (возможно) увеличения стабильности. Также в PDB файле данной структуры содержится внушительный перечень нерасшифрованных аминокислотных остатков, которые соответствуют N и C-концам белка:
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 MET B 1 REMARK 465 ALA B 2 REMARK 465 GLU B 236 REMARK 465 GLU B 237 REMARK 465 THR B 238 REMARK 465 VAL B 239 REMARK 465 ARG B 240 REMARK 465 LYS B 241 REMARK 465 ALA B 242 REMARK 465 MET B 243 REMARK 465 GLU B 244 REMARK 465 ALA B 245 REMARK 465 VAL B 246 REMARK 465 ALA B 247 REMARK 465 ALA B 248 REMARK 465 GLN B 249 REMARK 465 GLY B 250 REMARK 465 LYS B 251 REMARK 465 ALA B 252 REMARK 465 LYS B 253 REMARK 465 LYS B 254 REMARK 465 LEU B 255 REMARK 465 GLU B 256 REMARK 465 HIS B 257 REMARK 465 HIS B 258 REMARK 465 HIS B 259 REMARK 465 HIS B 260 REMARK 465 HIS B 261 REMARK 465 HIS B 262 ... далее идет примерно такой же список для цепи С
Интересно заметить, что весь тэг вошел в этот список.
Пример лучшего и худшего B-фактора в структуре
В PDB файле структуры из предыдущего пункта я нашла атомы с лучшим (наименьшим) и худшим (наибольшим) B-фактором (последняя цифра в строчках):
ATOM 482 NH1 ARG B 62 -15.395 10.204 -42.814 1.00 27.70 N ATOM 1875 OD1 ASP B 235 -24.020 -14.224 -39.742 1.00 86.29 O
Как уже было сказано, B-фактор характеризует размазанность электронной плотности атома относительно предсказанного положения его центра. Что обусловлено небольшой вариабельностью реального положения атомов в кристалле, из-за чего при интегрировании сигналов от каждой молекулы белка на детекторе, мы увидим слегка размытую точку. Значения B-фактора меньше 10 Å2 говорят о "жестком" положении атома, когда значения порядка 50 Å2 - о его высокой подвижности.