Изучение полноты данных в файле структурных факторов

Изучение полноты данных в файле структурных факторов для структуры 3D30.

Для выполнения практикума была выбрана структура 3D30, работа с которой велась на первом курсе. Указанно разрешение структуры 1.9 Å при полноте данных 99.7% в интервале от 1.90 Å до 45.40 Å.

Из PDB был получен файл со структурными факторами 3d30-sf.cif. Из него была получена таблица со структурными факторами 3d30-sf.xlsx

Число структурных факторов в файле указано в следующем виде:

_reflns.number_all 38980
_reflns.number_obs 38922

Определение числа неизмеренных структурных факторов.

В задании дано следующее определение для неизмеренных структуных факторов: "Не измеренные структурные факторы соответствуют явно пропущенным тройкам чисел (h,k, l). Явно пропущенные - это такие, что (1) их нет в файле; (2) хотя бы одна тройка (h',k', l') с h'>=h, k'>=k, l'>=l Присутствует в файле."

Однако в таблице структурных факторов для структуры 3D30 встречаются строчки со следующим содержанием:

_refln.index_h _refln.index_k _refln.index_l _refln.status _refln.F_meas_au _refln.F_meas_sigma_au _refln.F_calc _refln.phase_calc _refln.fom
0 2 4 x ? ? 11620.4 180 0
0 3 3 x ? ? 21300.1 0 0
0 4 0 x ? ? 44782.1 0 0
0 4 2 x ? ? 9762.1 180 0
0 5 11 x ? ? 7806.4 180 0
1 66 37 x ? ? 81.9 81.9 0
25 50 51 x ? ? 136.3 218.8 0
25 51 50 x ? ? 67.9 270.2 0
26 45 55 x ? ? 120.9 95.8 0
30 39 39 x ? ? 114.8 5.2 0

Кроме того, если взять любой произвольный участок таблицы, можно увидеть, что все значения для вектора l, идут через один:

_refln.index_h _refln.index_k _refln.index_l _refln.status _refln.F_meas_au _refln.F_meas_sigma_au _refln.F_calc _refln.phase_calc _refln.fom
0 3 53 o 151.8 44.0 54.3 180.0 0.42
0 3 55 o 143.9 48.1 218.4 180.0 0.92
0 3 57 o 130.6 49.2 21.0 0.0 0.23
0 3 59 o 107.0 45.8 146.1 180.0 0.69

По данному определению получается, что каждый второй фактор не измерен, хотя указано, что всего возможных факторов 38980, а измерено 38922. Попробуем разобраться.

Всего в колонке _refln.status встречается три значения: o, f, x. Если я правильно поняла, то f – это число структурных факторов, использованных для построения модели. Итак, число факторов, соответствующих этим значениям:

Число структурных факторов, использованных для оптимизации модели (o) 36971
Число структурных факторов, использованных для построения модели (f) 1951
Число неизмеренных структурных факторов (x) 58
Всего 38980

Получается, что только факторы со статусом x считаются неизмеренными, и их немного по сравнению с общим числом факторов. «Полнота данных» = (38922/38980)*100% = 99.85%.


© Анисимова Александра, 2015