На сайте PDB был взят файл структурных факторов 1yoc_struct.cif для белка 1yoc.
Далее был сделан файл в формате 1yoc_struct.xlsx, где данные были разделены по следующим колонкам целые числа h, k, l - три колонки; F_meas_au - среднее значение измерений структурного фактора; F_meas_sigma_au - ср. кв. отклонение от среднего. Количество измеренных структурных факторов составило 59 643.


В колонке F/sigma отражена сила измеренного сигнала. На основе этой колонки был рассчитан процент "хороших" структурных факторов. Условно, измерение структурного фактора считается хорошим, если его значение в три раза или больше превосходит среднее квадратичное нескольких его измерений. Хороших получилось 47 269, что составило 79,25% от общего количества измеренных структурных факторов.


В колонке status указано, использовался ли структурный фактор для оптимизации модели. Значение "о" указывает на то, что данный структурный фактор был использован для оптимизации, а "f" — нет. Для данной структуры были использованы для оптимизации 58 534 (98,14%).

На рис.1 приведен пример пропущенных троек, которых нет среди измеренных структурных факторов,но есть измеренные структурные факторы (h',k', l') с h'>=h, k'>=k, l'>=l.