Был проведён поиск с помощью advanced search по параметрам: структуры, решенные с помощью X-ray с разрешением меньше 1 ангстрема, последних лет.
Была найдена структура 6I7Y (Crystal Structure of the first bromodomain of BRD4 in complex with RT56), в которой 43-й остаток - метионин - принимает в кристалле две конформации с равной вероятностью (и потому имеет два alter code - AMET и BMET). Строчки PDB-файла, описывающие ситуацию:
ATOM 6 N AMET A 43 34.984 3.622 8.600 0.50 11.92 N ANISOU 6 N AMET A 43 1470 1300 1759 232 -447 -33 N ATOM 7 N BMET A 43 36.476 4.230 8.265 0.50 17.40 N ANISOU 7 N BMET A 43 1738 2105 2764 617 -1068 -1534 N ATOM 8 CA AMET A 43 34.609 4.266 9.842 0.50 12.71 C ANISOU 8 CA AMET A 43 1810 1343 1673 -207 5 164 C ATOM 9 CA BMET A 43 35.431 4.628 9.192 0.50 15.21 C ANISOU 9 CA BMET A 43 1595 1821 2363 376 -961 -779 C ATOM 10 C AMET A 43 34.717 5.772 9.691 0.50 10.01 C ANISOU 10 C AMET A 43 1741 1286 775 -109 -142 -115 C ATOM 11 C BMET A 43 35.304 6.146 9.314 0.50 13.84 C ANISOU 11 C BMET A 43 1450 1827 1978 459 -347 -544 C ATOM 12 O AMET A 43 35.702 6.250 9.157 0.50 10.74 O ANISOU 12 O AMET A 43 1814 889 1377 119 248 -68 O ATOM 13 O BMET A 43 36.234 6.898 9.009 0.50 12.93 O ANISOU 13 O BMET A 43 1397 1516 1999 643 -349 -642 O ATOM 14 CB AMET A 43 35.535 3.804 10.980 0.50 13.73 C ANISOU 14 CB AMET A 43 2156 1337 1723 99 268 687 C ATOM 15 CB BMET A 43 35.745 4.039 10.569 0.50 16.31 C ANISOU 15 CB BMET A 43 2427 943 2825 433 -625 -215 C
Поиск по PDB проводился с условием низкого расширения (больше 3 ангстрем).
Была найдена структура 6Y3C (Human COX-1 Crystal Structure), в которой отсутствуют 17 остатков. Возможно, остатки более подвижные, чем остальные, поэтому их не удалось распознать. Строчки PDB-файла, описывающие ситуацию ниже:
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 ALA A 25 REMARK 465 ASP A 26 REMARK 465 PRO A 27 REMARK 465 ALA A 585 REMARK 465 SER A 586 REMARK 465 GLN A 587 REMARK 465 ASP A 588 REMARK 465 ASP A 589 REMARK 465 GLY A 590 REMARK 465 PRO A 591 REMARK 465 ALA A 592 REMARK 465 VAL A 593 REMARK 465 GLU A 594 REMARK 465 ARG A 595 REMARK 465 PRO A 596 REMARK 465 SER A 597 REMARK 465 THR A 598 REMARK 465 GLU A 599 REMARK 465 LEU A 600
Был осуществлён поиск с помощью опции Wild Type protein из раздела Sequence Features.
Была найдена структура 6JYB (Structure of light-state marine bacterial chloride importer, NM-R3, with CW laser (ND-10%) at 95K), белок для которой нарабатывался в Escherichia coli BL21(DE3) и потому содержит тэг для удобства выделения белка. Строка DBREF содержит имя последовательности белка в UniProt, а строчки SEQADV - остатки тегов на N- и C-конце. Согласно статье, вместе с которой опубликована структура, последовательность белка была включена в состав вектора pET-21, содержащего два тега - T7 (Nterm), His (Cterm), что и мы и наблюдаем в строчках из PDB-файла ниже. Интересно было увидеть, что в гексагистидиновом теге собственно шести гистидинам предшествуют два двугих остатка.
DBREF 6JYB A 1 272 UNP W8VZW3 W8VZW3_9FLAO 1 272 SEQADV 6JYB MET A -15 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB ALA A -14 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB SER A -13 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB MET A -12 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB THR A -11 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLY A -10 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLY A -9 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLN A -8 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLN A -7 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB MET A -6 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLY A -5 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB ARG A -4 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB ASP A -3 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB PRO A -2 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB ASN A -1 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB SER A 0 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB LEU A 273 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB GLU A 274 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 275 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 276 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 277 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 278 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 279 UNP W8VZW3 EXPRESSION TAG SEQADV 6JYB HIS A 280 UNP W8VZW3 EXPRESSION TAG
У той же структуры есть список нерасшифрованных остатков, куда попали N- и C-концы белка: оба тега и ещё несколько остатков. Ниже строки из PDB-файла, описывающие ситуацию:
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 MET A -15 REMARK 465 ALA A -14 REMARK 465 SER A -13 REMARK 465 MET A -12 REMARK 465 THR A -11 REMARK 465 GLY A -10 REMARK 465 GLY A -9 REMARK 465 GLN A -8 REMARK 465 GLN A -7 REMARK 465 MET A -6 REMARK 465 GLY A -5 REMARK 465 ARG A -4 REMARK 465 ASP A -3 REMARK 465 PRO A -2 REMARK 465 ASN A -1 REMARK 465 SER A 0 REMARK 465 MET A 1 REMARK 465 GLY A 266 REMARK 465 MET A 267 REMARK 465 ASP A 268 REMARK 465 SER A 269 REMARK 465 LYS A 270 REMARK 465 ALA A 271 REMARK 465 ALA A 272 REMARK 465 LEU A 273 REMARK 465 GLU A 274 REMARK 465 HIS A 275 REMARK 465 HIS A 276 REMARK 465 HIS A 277 REMARK 465 HIS A 278 REMARK 465 HIS A 279 REMARK 465 HIS A 280
В структуре из предыдущего примера наличествуют остатки с B-факторами: 71.74 и 11.64, вероятно, атом с большим значением фактора более подвижен и имеет "размазанную" электронную плотность, поэтому определение его координат считается менее надёжным:
ATOM 6 CG LYS A 2 -16.481 -13.601 22.007 1.00 71.74 C ATOM 170 CA LEU A 22 -13.113 -32.975 10.385 1.00 11.64 C