Знакомство с файлом структурных факторов

Для выполнения задания использовались ранее выбранная структура белка (см. практикум 1) 5T30. Из PDB был загружен файл структурных факторов в формате mmCIF, который был приведен к следующему виду.

Всего в таблице указано 42583 позиции, из них реальные значения соответствуют 40061, среди которых хороших структурных факторов было 86,3%. Для оптимизации использовали 38097 структурных фактора. Также в таблицу была добавлена колонка "сила сигнала", показывающая, во сколько раз значение структурного фактора F_calc превосходит среднее квадратичное отклонение F_sigma.

Хороший структурный фактор - такой, значение которого хотя бы в 3 раза превосходит среднее квадратичное отклонение (F_sigma) нескольких его измерений.
Пропущенная тройка h, k, l- такая, которой нет среди измеренных структурных факторов, но есть измеренный структурный фактор (h', k', l') с h'≥h, k'≥k, l'≥l.

Определение не универсальное, поскольку всегда есть нижняя граница разрешения (рефлексы, попадающие на заглушку). Кроме того, исключения могут быть связанны с симметрией кристалла. Так, на рис. 1 приведены строки, с т.н. пропущенными тройками, у них есть значения h, k, l, но в графе "F" стоит знак вопроса (в таблице я заменила его на 0). В колонке "status" у них - "x".


Рисунок 1. Примеры пропущенных троек.