Изучение файла структурных факторов







1. Примеры атомов с коэффициентом заполнения (Occupancy), не равным 1

При качественным разрешением структуры (в данном случае рассматривается разрешение < 1) может возникнуть ситуация, когда коэффициент заполнения (Occupancy) меньше 1.
Это означает, что в части элементарных ячеек центр атома имеет одни координаты, а в части - другие, что может иметь функциональное объяснение. Например, белок может кристаллизоваться в двух конформациях или какие-то группы остатков могут изменять свое положение под действием ионов металлов аналогов переходного состояния и проч.
Для поиска такой структуры был проведен расширенный поиск по PDB с параметрами X-ray resolution 0-1 A и датой создания записи между 2019-01-01 и 2020-01-01. Всего была найдена 31 запись. Для дайнейшего анализа я выбрал структуру с PDB ID: 6KKZ.
В найденной структуре позиция отдельных атомов была определена неоднозначно (рис 1).
Для каждого атома указывается свой код и коэффициент заполнения, отражающий долю ячеек с таким положением данного атома.

Рисунок 1. Примеры атомов с коэффициентом заполнения (Occupancy), не равным 1. PDB ID: 6KKZ.



2.Нерасшифрованные аминокислотные остатки


Нерасшифрованными называются такие остатки, электронная плотность которых не может быть однозначно согласована с аминокислотной последовательностью.
Такое может случиться, например, если в структуре с низким разрешением есть группа подвижных остатков, контактирующих с раствором.
Для поиска такой структуры был проведен расширенный поиск по PDB с параметрами X-ray resolution 3-4 A.
Всего была найдена 10328 записей. Для дайнейшего анализа я выбрал структуру с PDB ID: 6KDV.

Рисунок 2. Нерасшифрованные аминокислотные остатки. PDB ID: 6KDV.



3. PDB структура белка, с которой связаны три последовательности

(1) последовательность природного белка из Uniprot;
(2) последовательность белка, который кристаллизовали;
(3) та часть последовательности (2), которая соответствует "видимой" методом РСА.

Из файла PDB можно узнать, на какую каноническую последовательность из базы данных UniProt ссылается эксперимент - последовательность природного белка.
Из поля DBREF можно узнать о случаях несовпадения канонического белка (1) и кристаллизованного белка (2) (рис. 3).
Поле SEQADV указывает на измененные аминокислоты, которые соответствуют "видимой" методом РСА последовательности. Добавлены хромофор и мутации.
В разделе "Missing residues" указаны нерасшифрованные атомы на С- или N- конце белковой цепи (рис. 2).


Рисунок 3. Изменения относительно природного белка из Uniprot + "добавки".




4. Наибольший и наименьший B-фактор в структуре

В-фактор характеризует то насколько хорошо атом вписывается в предсказанную электронную плотность. Чем ниже В-фактор, тем точнее можно определить координаты атома в структуре.
Ниже показаны примерные максимумы и минимумы этого параметра для структуры с PDB ID: 6KDV.

Максимальные значения:
ATOM 4533 C GLU D 84 45.828 56.854 8.103 1.00 246.50 C
ATOM 4532 CA GLU D 84 44.601 57.273 7.393 1.00 244.91 C
ATOM 4534 O GLU D 84 46.907 56.942 7.554 1.00 240.44 O


Могут быть объснены высокой подвижностью глутамата, болтающегося на конце D цепи. В челом, положение атомов, входящих в остаток глутамата осложняется наличием двух молекул кислорода на конце и длинной углеродной цепью. Однако здесь были найдены атомы остова, что говорит о его высокой подвижности и крайней неопределенности положения вписываемой цепи.

Минимальные значения:
ATOM 4385 CB ARG D 63 50.843 69.468 -3.294 1.00 42.89 C
ATOM 5374 O LEU D 191 43.655 69.071 20.121 1.00 68.41 O
ATOM 299 CB THR B 62 43.928 43.745 7.132 1.00 68.62 C


В случае первого аргинина наблюдается интересная ситуация. Данный атом со всех сторон окружен атомами с В-фактором > 100 и при этом сам имеет значение данного параметра равным 42.89. Видимо, не удалось достроить оставшуюся цепь и программа просто поставила CB атом в центр имевшейся плотности, что увеличило В-фактор.


Рисунок 4. Аномально низкое, относительно окружения, значение В-фактора для атома ARG 63. PDB ID: 6KDV.




Ссылки

  1. PDB: 6KDV
  2. PDB: 6KKZ