4.Поиск по PDB и содержание PDB файла1. Occupancy ≠ 1В структурах с высоким разрешением, когда уже начинат быть видны атомы водорода, часто можно найти такие атомы, для которых Так на пример я взял структуру белка delta-N METTL16 MTase (PDB ID:4XXG) c разрешением 2.3Å, у которой occupancy может быть меньше еденицы для любого атома. Это весьма удачно показанно на примере идущих подряд строк из PDB файла (Occupancy - второе с конца число, т.е. для первой строки это 0.60 и т.д.): ATOM 3246 CD AGLN A 201 35.288 -21.768 7.019 0.60 12.27 C ATOM 3247 CD BGLN A 201 34.320 -21.975 6.293 0.40 11.44 C ATOM 3248 OE1AGLN A 201 34.578 -22.770 6.855 0.60 14.33 O ATOM 3249 OE1BGLN A 201 35.524 -21.746 6.443 0.40 11.59 O ATOM 3250 NE2AGLN A 201 36.566 -21.741 6.688 0.60 13.50 N ATOM 3251 NE2BGLN A 201 33.865 -22.875 5.434 0.40 12.68 N ATOM 3252 H AGLN A 201 34.262 -18.851 9.950 0.60 7.73 H ATOM 3253 H BGLN A 201 34.291 -18.812 9.971 0.40 9.19 H ATOM 3254 HA AGLN A 201 32.544 -19.009 7.997 0.60 9.57 H ATOM 3255 HA BGLN A 201 32.564 -18.804 7.997 0.40 11.34 H ATOM 3256 HB2AGLN A 201 33.874 -21.122 9.313 0.60 12.05 H ATOM 3257 HB2BGLN A 201 34.596 -19.901 7.785 0.40 13.94 H 2. Missing residuesПо возможности я старался использовать "свою" структуру 5TYB. У нее имеются "отсуствующие остатки", хотя разрешение структуры совсем не плохое - 1.85 Å. REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 GLY A 127 REMARK 465 SER A 128 REMARK 465 ALA A 129 REMARK 465 ALA A 130 REMARK 465 ALA A 131 REMARK 465 PRO A 132 REMARK 465 LEU A 133 REMARK 465 SER A 134 REMARK 465 PRO A 135 REMARK 465 ALA A 136 REMARK 465 HIS A 365 REMARK 465 GLN A 366 REMARK 465 HIS A 367 REMARK 465 SER A 368 REMARK 465 CYS A 369 REMARK 465 CYS A 370 REMARK 465 GLU A 371 REMARK 465 SER A 372 REMARK 465 PRO A 373 REMARK 465 THR A 374 REMARK 465 ARG A 375 REMARK 465 LEU A 376 REMARK 465 ALA A 377 REMARK 465 GLN A 378 REMARK 465 GLN A 379 REMARK 465 SER A 380 REMARK 465 HIS A 381 REMARK 465 MET A 382 REMARK 465 ASP A 383 Видно, что остатки отсутствуют в начале цепи А (127-136) и в конце (365-383). Для данной структуры только цепь А является аминокслотной, что может объяснить отсутстве остатков только у одной цепи. 3. Отличие последовательностейДля белка из пункта 1 также удобно показать и различие в последовательности кристализованного белка и связанной с ним записью в UniProt, т.к. у белка из PDB имеется гексагистидиновый тег (для удобства выделения): DBREF 4XXG A 6 509 UNP P12676 CHOD_STRS0 43 546 SEQADV 4XXG HIS A 510 UNP P12676 EXPRESSION TAG SEQADV 4XXG HIS A 511 UNP P12676 EXPRESSION TAG SEQADV 4XXG HIS A 512 UNP P12676 EXPRESSION TAG SEQADV 4XXG HIS A 513 UNP P12676 EXPRESSION TAG SEQADV 4XXG HIS A 514 UNP P12676 EXPRESSION TAG SEQADV 4XXG HIS A 515 UNP P12676 EXPRESSION TAG 4. Лучший и худший B-факторДля поиска лучшего и худчшего B-фактора я использовал PDB файл структуры 5TYB (как и в пунктке 2). Вот нужные строчки из файла. ATOM 1521 N ARG A 323 0.012 -7.338 0.042 1.00 8.84 N ATOM 609 NE2 GLN A 214 22.493 -29.461 -19.115 1.00 77.67 N Б-фактор расположен в конце, т.е. лучший равен 8.84, а худший - 77.67. \Б-фактор так же называют температурным фактором. Значения ниже 10 говорят о низкой подвижности атома, а выше 50 - о наоборот, слишком сильном "размазывании" его электронной плотности.
|