В базе данных PDBe был осуществлен расширенный поиск с параметрами "Experimental method: x-ray diffraction" и "Resolution ≤ 1" (так как нам нужно найти pdb файл, в котором есть атомы с коэффициентом Occupancy, не равным 1). Я выбрала структуру лигазы YrbA в комплексе с никелем ( 5NFK [1]). Строки содержат описание альфа-атома углерода:
ATOM 106 CA BMET A 11 9.389 -6.337 5.829 0.47 4.79 C ATOM 107 C AMET A 11 10.397 -5.609 4.934 0.53 4.65 C
Первые 3 числа - это координаты, 4ое число с коэффициент Occupancy, не равный 1. В 47% молекул атом находится в точке с координатами из верхней строчки, а в 53% — из нижней.
Для того, чтобы найти белки с missing residues, надо расширить поиск "Resolution ≥3». Я выбрала белок HypT (5YDW[2]) из Salmonella typhimuriuma. Эти остатки называются так, потому что они находятся в подвижных участках, которые не расшифровываются и в PDB файле они находятся в поле REMARK.
REMARK 465 MISSING RESIDUES REMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THE REMARK 465 EXPERIMENT. (M=MODEL NUMBER; RES=RESIDUE NAME; C=CHAIN REMARK 465 IDENTIFIER; SSSEQ=SEQUENCE NUMBER; I=INSERTION CODE.) REMARK 465 REMARK 465 M RES C SSSEQI REMARK 465 GLY A -1 REMARK 465 ALA A 0 REMARK 465 MET A 1 REMARK 465 ASP A 2 REMARK 465 VAL A 3 REMARK 465 THR A 4 REMARK 465 GLY A 5 REMARK 465 ALA A 6 REMARK 465 GLY A 7 REMARK 465 SER A 63 REMARK 465 PRO A 64 REMARK 465 GLY B -1 REMARK 465 ALA B 0 REMARK 465 MET B 1 REMARK 465 ASP B 2 REMARK 465 VAL B 3 REMARK 465 THR B 4 REMARK 465 GLY B 5 REMARK 465 ALA B 6 REMARK 465 GLY B 7 REMARK 465 LEU B 8 REMARK 465 HIS B 9 REMARK 465 SER B 96 REMARK 465 ASP B 97 REMARK 465 TYR B 98 REMARK 465 THR B 99
Как видно из выдачи полей, цепь В расшифрована хуже. Остатки из цепи В включают в себя такие же остатки из цепи А.
С PDB структурой белка связаны три последовательности: (1) последовательность природного белка из Uniprot; (2) последовательность белка, который кристаллизовали - он может отличаться наличием тэгов, и быть частью природного белка, например, доменом; (3) та часть последовательности (2), которую удалось кристаллизовать. Здесь требуется привести один пример, в котором (1) и (2) не совпадают. Для этого в advanced search использовался поиск Wild Type protein из раздела Sequence Features. Я выбрала структуру глюкозоизомеразы (5ZYC[3]) из Streptomyces rubiginosus.
В файле поле DBREF c UNP (от Uniprot) - это кросс-референс между SEQADV (нашей последовательностью) и Uniprot (в данном случае).
DBREF1 5YDW A 1 302 UNP A0A0J5DK07_SALTM DBREF2 5YDW A A0A0J5DK07 1 302 DBREF1 5YDW B 1 302 UNP A0A0J5DK07_SALTM DBREF2 5YDW B A0A0J5DK07 1 302 SEQADV 5YDW GLY A -1 UNP A0A0J5DK0 EXPRESSION TAG SEQADV 5YDW ALA A 0 UNP A0A0J5DK0 EXPRESSION TAG SEQADV 5YDW GLY B -1 UNP A0A0J5DK0 EXPRESSION TAG SEQADV 5YDW ALA B 0 UNP A0A0J5DK0 EXPRESSION TAG
Как можно видеть, все комментарии ко всем мутациям - «EXPRESSION TAG».
B-фактор непосредственно связан со среднеквадратичным изотропным смещением атома. Его значения содержатся в поле ATOM records. Была рассмотрена структура из первого задания. В PDB файле это предпоследний столбец. Наихудший:
ATOM 20 OE1 GLN A 4 40.676 15.252 18.194 1.00 43.52 O
Наилучший:
ATOM 2162 CG LEU A 271 33.654 3.661 34.248 1.00 7.53 C
1. PDB // URL: http://www.rcsb.org/structure/5NFK
2. PDB // URL:http://www.rcsb.org/structure/5YDW
3.PDB // URL: http://www.rcsb.org/structure/5ZYC
© Yuliia Preobrazhenskaya, 2015-2016